


ET 图 灵 程 序 设计 从 书 


[ 美 ] Regina Obe Leo Hsu 著 
丁 奇 鹏 译 


加 中 国 工 信 出 版 集团 。” 允 估 民 邮 电 出 版 社 


N 





POSTS & TELECOM PRESS 


效 字 有 版权 声明 


图 灵 社 区 的 电子 书 没有 采用 专 有 客 
户 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
己 喜 欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 用 ， 
未 经 授权 ， 不 得 进行 传播 。 

我 们 愿意 相信 读者 具有 这 样 的 良知 
和 觉悟 ， 与 我 们 共同 保护 知识 产权 。 


如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实 施 包括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 追究 法 律 
责任 。 





丁 奇 鹏 

2001 年 毕业 于 南京 航空 航 
天 大 学 计算 数学 专业 ， 先 
后 在 中 兴 和 华为 从 事 企业 
自 有 数据 库 的 研发 与 技术 管理 等 工作 十 
余年 ， 对 关系 型 数据 库 的 理论 体系 和 内 
核实 现 均 有 深入 研究 ， 对 于 数据 库 技术 
在 CT 领域 的 应 用 拥有 丰富 的 实践 经 验 ， 
对 PostgreSQL 和 MySQL 等 开源 数据 库 也 
有 着 浓厚 兴趣 。 现 就 职 于 华为 固定 网 络 
产品 线 ， 专 注 于 为 华为 “ 云 管 端 ”战略 
体系 中 的 “管道 操作 系统 ”进行 分 布 式 
内 存 数 据 库 的 研发 以 及 性 能 优化 工作 。 





ER 图 录 答 启 设计 从 书 


PostgreSQL 即 学 即 用 《第 2 版 ) 
PostgreSQL: Up and Running 


Second Edition 





[ 美 ] Regina Obe Leo Hsu 著 
丁 奇 鹏 译 


Beijing * Cambridge » Farnham » Koln »。 Sebastopol « Tokyo 
O’Reilly Media, Inc. 授 权 人 民 邮 电 出 版 社 出 版 


人 人民 邮 电 出 版 社 


ek 


北 页 


图 书 在 版 编目 (C I P ) 数据 














PostgreSQL 即 学 即 用 : 第 2 版 / ( 美 ) 奥 岁 
(Obe, R. ) ，( 美 ) 徐 (Hsu,L.) 车 ; 丁 奋 月 译 . -- 北京 : 
人 民 邮 电 出 版 社 ，2016. 1 
(图 灵 程 序 设计 从 书 ) 
ISBN 978-7-115-41128-0 


I .DP… [，Q 奥 … 四 徐 … @@ 本 … I[， WW 关系 数 
据 库 系统 人. @TP311. 132. 3 


到 版 本 图 书馆 CIP 数 据 核 字 (2015) 第 285900 号 


















































内 容 提 要 


本 书 将 帮助 你 理解 和 使 用 PostgreSQL 这 一 开源 数据 库 系 统 。 你 不 仅 会 学 到 版 本 9.2.9.3 和 9.4 
中 的 企业 级 特性 ， 还 会 发 现 PostgreSQL 不 只 是 个 数据 库 系 统 ， 也 是 一 个 出 色 的 应 用 平台 。 本 书 通 
过 示例 展示 了 如 何 实现 在 其 他 数据 库 中 难以 或 无 法 完成 的 任务 。 这 一 版 内 容 履 盖 了 LATERAL 查 
询 、 增 强 的 JSON 支持 、 物 化 视图 和 其 他 关键 话题 。 

本 书 适合 数据 库 管理 员 、 后 端 开发 人 员 以 及 其 他 对 PostgreSQL 感 兴 趣 的 读者 。 
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PostgreSQL (http://www.postgresql.org/) 是 一 个 开源 的 关系 型 数据 库 管 理 系统 ， 最 初 源 于 
加 州 大 学 伯克利 分 校 的 一 个 研究 项 目 。 该 系统 最 早 是 基于 BSD 许可 证 发 布 的 ， 但 目前 已 
改 为 使 用 PostgreSQL 许可 证 (简称 TPL) 发 布 。 事 实 上 这 两 种 许可 证 无 论 从 哪 方 面 看 都 
没有 区 别 。PostgreSQL 的 悠久 历史 可 追溯 到 1985 年 。 














PostgreSQL 拥有 诸多 企业 级 特性 ， 比 如 支持 窗口 函数 (用户 可 以 自 定义 聚合 函数 并 当 作 窗 
口 国 数 使 用 )、 普 通 CTE 表达 式 、 递 归 CTE 表达 式 以 及 流 式 复 制 等 。 这 些 特性 在 Oracle、 
SQL Server、DB2 等 较 新 版 本 的 商用 数据 库 中 很 常见 ， 但 在 开源 数据 库 界 却 几乎 没有 。 另 
外 ，PostgreSQL 有 一 点 与 众 不 同 ， 它 可 以 在 不 用 重 编译 任何 代码 的 情况 下 轻松 实现 系统 功 
能 的 扩展 。PostgreSQL 不 但 支持 众多 高 级 特性 ， 而 且 性 能 也 很 好 ， 在 很 多 应 用 场景 下 其 性 
能 其 至 可 以 超越 包括 商用 数据 库 在 内 的 大 多 数 数据 库 。 


本 书 将 介绍 PostgreSQL 的 诸多 高 级 特性 ， 其 中 有 的 特性 是 ANSI SQL 标准 中 所 规定 的 ， 
而 有 的 特性 是 PostgreSQL 自己 独创 的 。 如 果 你 当前 正在 使 用 PostgreSQL， 又 或 者 以 前 曾 
用 过 但 了 解 程度 一 般 ， 那 么 通过 本 书 可 以 学 到 之 前 可 能 错过 的 一 些 功 能 “ 遗 珠 "”， 还 可 以 
了 解 到 最 新 几 个 版 本 中 引入 的 新 特性 。 本 书 适 合 对 关系 型 数据 库 有 一 定 使 用 经 验 的 读者 ， 
但 不 要 求 使 用 过 PostgreSQL。 书 中 将 对 比 PostgreSQL 与 其 他 数据 库 处 理 同一 任务 的 机 
制 ， 同 时 也 将 展示 只 有 PostgreSQL 才 支 持 的 一 些 “ 高 大 上 ”功能 ， 这 些 功 能 在 别 的 数据 
库 中 要 么 实现 起 来 很 困难 ， 要 么 根本 不 可 能 实现 。 如 果 你 完全 未 使 用 过 数据 库 ， 通 过 本 书 
也 可 以 学 到 PostgreSQL 的 功能 和 使 用 方法 。 不 过 ， 鉴 于 本 书 的 定位 ， 书 中 不 会 过 多 介绍 
关于 SQL 或 者 关系 型 数据 库 理 论 方面 的 基础 知识 ， 我 们 建议 你 阅读 其 他 相关 书籍 来 了 解 


这 些 内 容 。 











































































































本 书 主要 介绍 PostgreSQL 9.2、9.3 和 9.4 版 ， 但 也 会 覆盖 一 些 在 更 早 版 本 中 已 支持 的 高 级 
特性 。 


Xi 


本 书 读者 


我 们 希望 本 书 对 数据 库 行 业 现 有 从 业 人 员 以 及 刚刚 开始 从 事 数 据 库 领域 工作 的 读者 能 够 有 
所 帮助 。 具 体 来 说 ， 本 书面 向 的 读者 群 如 下 。 


。 如 果 你 正在 学 习 关 系 型 数据 库 ， 那 么 我 们 希望 本 书 能 够 对 你 有 所 帮助 ， 并 希望 你 在 
将 来 的 职业 生涯 中 青睐 于 PostgreSQL。 为 了 降低 难度 ， 我 们 在 本 书 第 2 版 中 对 许 
多 专题 进行 了 拓展 介绍 ， 并 尽 可 能 提供 了 入 门 级 的 例子 。 

。 如 果 你 当前 已 经 是 PostgreSQL 的 用 户 或 者 DBA， 那 么 我 们 希望 此 书 能 让 你 的 工作 
更 加 得 心 应 手 。 书 中 会 有 你 已 经 熟悉 的 内 容 ， 但 也 一 定 会 有 你 不 熟悉 的 一 些 技巧 ， 
以 及 新 版 本 中 引入 的 新 特性 ， 如 果 善 加 利用 ， 必 定 会 提高 你 的 工作 效率 。 好 吧 ， 如 
果 你 真 的 很 出 色 并 且 对 书 中 内 容 均 已 了 解 ， 那 么 本 书 对 你 来 说 依然 有 价值 ， 为 什么 
呢 ? 因为 它 比 官方 的 PostgreSQL 手册 要 轻 上 20 倍 ， 最 起 码 是 便于 携带 了 。 

。 如 果 你 还 没 接触 过 PostgreSQL， 那 么 本 书 除 了 能 够 向 你 介绍 PostgreSQL 知识 外 ， 
还 将 扮演 你 身边 的 PostgreSQL “布道 师 ” 的 角色 ， 这 位 “布道 师 ” 将 向 你 证 明 : 
多 绑 在 商业 数据 库 上 一 天 ， 你 就 会 被 那些 厂商 掏 走 更 多 的 钱 ， 多 用 那些 “ 烂 ”数据 
库 一 天 ， 你 的 系统 就 不 得 不 多 做 一 天 功能 上 的 妥协 。 


如 果 你 的 工作 与 数据 库 领 域 甚至 是 全 界 毫 无 关系 ， 又 或 者 你 刚刚 幼儿 园 毕 业 ， 那 么 能 否 购 
买 本 书 呢 ? 答案 依然 是 可 以 的 ! 因为 封面 上 可 爱 的 象 购 鼠 图 片 就 已 经 让 本 书 物 有 所 值 了 。 


PostgreSQL 的 特别 之 处 以 及 选用 理由 


PostgreSQL 之 所 以 特别 ， 是 因为 它 不 仅仅 是 一 个 数据 库 ， 还 是 一 个 功能 强大 的 应 用 开发 
平台 。 


PostgreSQL 支持 用 多 种 编程 语言 编写 存储 过 程 和 函数 。 除 了 系统 自 带 的 编程 语言 外 ， 还 可 
以 通过 安装 语言 扩展 包 来 支持 新 的 语言 。 内 置 的 基础 语言 包括 SQL 和 PL/pgSQL， 通 过 安 
装 扩展 包 还 可 以 支持 PL/Perl、PL/Python、PL/V8 (又 称 为 PL/JavaScript) 以 及 PL/R 等 。 
前 述 语 言 的 安装 包 在 PostgreSQL 发 行 版 中 大 多 都 已 自 带 ， 需 要 时 安装 一 下 扩展 包 即 可 使 
用 。 这 种 支持 多 语言 的 能 力 是 非常 有 价值 的 ， 因 为 每 种 语言 的 特点 不 同 ， 有 的 语言 适合 解 
决 特定 领域 内 的 问题 ， 有 的 语言 过 程 化 特性 更 丰富 ， 有 的 语言 语法 特性 更 强大 ， 那 么 开发 
人 员 就 可 以 根据 待 解决 问题 的 特点 来 选择 最 合适 的 语言 。 比 如 可 以 通过 使 用 R 语言 的 统计 
和 图 形 函 数 以 及 RR 语言 中 简洁 的 专业 表达 式 来 解决 统计 领域 的 问题 ， 可 以 通过 Python 来 
调用 Web 服务 ， 也 可 以 编写 map reduce 函数 并 在 SQL 语句 中 调用 。 




















































































































用 户 黄 至 可 以 写 一 个 聚合 函数 并 柳 入 到 上 述 这 些 语言 中 ， 这 样 就 可 以 把 SQL 语言 的 聚 
合 运算 能 力 与 上 述 语 言 本 身 的 能 力 相 结合 ， 从 而 拓展 了 这 些 语 言 的 能 力 范 围 。 此 外 ， 
PostgreSQL 还 支持 调用 C 语言 写 的 函数 ， 与 调用 上 述 其 他 语言 写 的 函数 没有 区 别 。 可 以 在 
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同一 个 SQL 语句 中 调用 分 别 由 不 同 语言 编写 的 多 个 函数 。 其 至 可 以 仅 使 用 SQL 语言 〈 即 
无 过 程 化 能 力 的 纯 SQL) 来 创建 一 个 用 户 自 定 义 聚 合 函 数 。 在 MySQL 和 SQL Server 中 ， 
用 户 自 定义 聚合 函数 是 需要 对 数据 库 软 件 本 身 进行 重 编译 才能 做 到 的 ， 但 在 PostgreSQL 中 
却 不 需要 。 简 而 言 之 ，PostgreSQL 对 多 语言 的 支持 是 极其 灵活 和 强大 的 ， 开 发 人 员 不 但 能 
够 为 不 同 任务 选择 不 同 的 编程 语言 ， 也 能 够 为 同一 任务 的 不 同 子 任务 选用 不 同 的 语言 。 另 
外 ， 在 其 他 绝 大 多 数 数据 库 都 不 允许 使 用 SQL 的 场景 下 ，PostgreSQL 也 允许 你 使 用 SQL。 
PostgreSQL 中 不 用 编译 任何 代码 就 可 以 创建 非常 复杂 的 函数 。 









































PostgreSQL 支持 非常 强大 的 用 户 自 定义 数据 类 型 功能 ， 不 但 使 用 方法 简单 ， 而 且 性 能 也 超 
越 了 7 绝 大 多 数 其 他 关系 型 数据 库 。 在 用 户 自 定义 数据 类 型 方面 ， 与 PostgreSQL 实力 最 接近 
的 对 手 只 有 Oracle。 用 户 可 以 在 PostgreSQL 中 定义 新 的 数据 类 型 ， 然 后 就 可 以 将 该 数据 类 
型 用 作 表 列 类 型 。 每 种 数据 类 型 都 有 伴随 的 数组 类 型 ， 这 样 可 以 将 某 个 类 型 的 数组 存储 到 
某 个 数据 列 中 ， 或 者 在 SQL 语句 中 使 用 该 数组 。 另 外 还 可 以 为 新 增 的 数据 类 型 定义 相应 的 
运算 符 、 函 数 和 索引 绑 定 来 与 其 协同 工作 。 很 多 PostgreSQL 的 第 三 方 扩展 包 就 利用 该 自 定 
义 数 据 类 型 能 力 来 优化 性 能 ， 或 者 通过 添加 支持 某 个 领域 专用 的 特殊 SQL 语法 来 让 业务 代 
码 更 简洁 和 易于 维护 ， 或 者 实现 一 些 在 别 的 数据 库 中 完全 不 可 能 实现 的 功能 。 


如 果 不 需 要 自 定义 数据 类 型 和 相应 的 函数 ， 那 么 系统 自 带 的 数据 类 型 也 是 种 类 繁多 
的 ， 比 如 json (在 9.2 版 中 引入 )， 另外 还 有 很 多 数据 类 型 扩展 包 可 供 选 择 。 很 多 这 类 
扩展 包 是 PostgreSQL 发 行 版 中 自 带 的 。 从 PostgreSQL 9.1 开始 引入 了 一 种 新 的 语法 : 
CREATE EXTENSION。 该 语法 仅 通过 一 条 SQL 语句 就 实现 了 扩展 包 的 安装 。 如 果 需 要 在 某 
个 数据 库 中 使 用 某 个 扩展 包 的 功能 ， 则 在 该 数据 库 中 安装 该 扩展 包 即 可 。 通 过 CREATE 
EXTENSION 语法 ， 可 以 安装 前 述 任何 一 种 过 程式 语言 (简称 PL)， 以 及 使 用 比较 广泛 的 数 
据 类 型 及 其 相应 的 函数 和 运算 符 ， 比 如 hstore 键 - 值 存储 、Ltree 层次 化 存储 、PostGIS 
地 理 空间 扩展 以 及 数不胜数 的 其 他 扩展 。 举 个 例子 ， 如 果 想 加 载 hstore， 只 和 需 执行 下 玫 


这 个 命令 即 可 : 










































































CREATE EXTENSION hstore; 
此 外 ， 有 一 条 SQL 命令 可 以 列 出 所 有 可 用 的 以 及 已 安装 的 扩展 包 ( 详 见 2.6 节 )。 


前 面 提 到 了 PostgreSQL 支持 各 种 扩展 ， 也 提 到 了 它 对 多 种 编程 语言 的 支持 ， 但 你 可 能 天 
这 些 都 不 感 兴趣 。 你 可 能 觉得 :“ 哦 ， 支 持 Python， 还 支持 Perl…… 可 那 又 怎么 样 ?能 不 
能 说 点 我 不 知道 的 ? ” 别 着 急 ， 当 我 们 继续 往 后 深入 学 习 的 时 候 ， 你 一 定 能 够 不 时 地 体会 
到 “ 哇 ， 这 个 功能 太 牛 了 ! ”这 样 的 惊喜 ， 而 这 样 的 惊喜 在 我 们 多 年 使 用 PostgreSQL 的 过 
程 中 已 经 体会 过 太 多 次 。PostgreSQL 的 每 次 升级 都 会 为 用 户 提 供 新 的 特性 ， 这 些 特性 包括 
易 用 性 的 升级 、 性 能 的 提升 ， 以 及 对 于 关系 型 数据 库 功 能 极限 的 不 断 超越 。 到 最 后 你 会 发 
现 : 我 为 什么 还 要 使 用 别家 的 数据 库 ? PostgreSQL 已 经 提供 了 我 所 需要 的 一 切 功能 了 啊 ， 
而 且 还 是 免费 的 ! 你 不 再 需要 去 阅读 那些 商业 数据 库 附 带 的 密密麻麻 的 授权 条 款 ， 来 了 解 
































在 一 个 8 核 服务 器 上 支持 甲 特性 、 乙 特性 和 两 特性 所 需要 的 费用 是 多 少 ， 也 不 需要 了 解 如 
果 服 务 器 CPU 从 8 核 升 级 到 16 核 后 要 再 为 许可 证 加 多 少 钱 。 


此 外 ，PostgreSQL 在 其 支持 的 所 有 平台 上 的 功能 表现 都 很 一 致 。 因 此 你 根本 不 需要 担心 你 
的 客户 要 求 支 持 哪 种 操作 系统 ，Unix、Linux、Mac OS X、Windows，PostgreSQL 全 都 支 
持 。PostgreSQL 官方 站 点 提供 各 种 操作 系统 下 的 二 进 制 安装 包 下 载 ， 当 然 你 也 可 以 自行 编 
译 安装 。 


不 适用 PostgreSQL 的 场景 


PostgreSQL 从 一 开始 就 被 设计 为 一 个 通用 的 事务 型 数据 库 。 很 多 人 把 它 用 在 小 型 的 桌面 应 
用 程序 中 ， 就 类 似 一 个 SQL Server Express 免费 版 或 者 是 Oracle Express 免费 版 。 但 这 种 
用 法 存在 的 问题 是 : 作为 一 个 独立 的 数据 库 系 统 ，PostgreSQL 自身 会 进行 全 面 的 安全 管 
里 (比如 用 户 登录 机 制 ， 这 个 机 制 在 在 入 式 场 景 下 是 不 需要 的 )， 这 些 都 是 要 耗费 性 能 的 ， 
但 PostgreSQL 又 无 法 取消 安全 机 制 并 将 其 交 由 上 层 应 用 去 管理 ， 因 此 单 用 户 应 用 场景 下 
PostgreSQL 可 能 不 是 最 好 的 选择 。 此 种 场景 下 SQLite 或 者 Firebird 是 更 合适 的 选择 ， 因 为 
用 户 权限 管理 、 安 全 检查 和 DB 操作 日 志 功 能 都 是 由 上 层 应 用 自己 完成 的 。 


令 人 遗憾 的 一 个 事实 是 ， 很 多 共享 主机 (多 个 租户 共享 同一 个 操作 系统 ) 供应 商 并 不 支持 
预 安装 PostgreSQL， 或 者 只 支持 安装 一 个 很 陈旧 的 版 本 。 因 此 ， 如 果 在 使 用 共享 主机 服 
务 ， 你 可 能 就 不 得 不 使 用 MySQL。 本 书 第 1 版 出 版 以 后 ， 这 个 情况 有 了 很 大 改善 。 目 前 
虚拟 专用 主机 和 云 服务 器 (每 个 租户 狼 享 一 个 操作 系统 ， 多 租户 之 间 互 不 干扰 ) 的 租用 价 
格 已 经 趋 于 合理 ， 而 且 会 越 来 越 便宜 。 与 共享 主机 相 比 ， 其 价格 不 会 高 出 很 多 ， 而 且 可 
以 在 上 面 安装 任何 你 希望 安装 的 软件 。 因 此 选择 专用 的 云 主机 服务 会 是 比较 明智 的 做 法 ， 
因为 你 可 以 安装 PostgreSQL 的 最 新 稳定 版 ， 而 无 需 受制 于 与 其 他 租户 共享 主机 时 的 种 种 
限制 。 此 外 ， 主 流 的 PaaS 平台 均 已 支持 PostgreSQL， 而 且 一 般 都 支持 最 新 的 发 行 版 。 这 
些 主流 平台 包括 : SalesForce Heroku PostgreSQL、Engine Yard、Red Hat OpenShift， 以 及 
Amazon RDS for PostgreSQL 。 
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PostgreSQL 的 功能 极其 强大 ， 强 大 到 “ 令 人 生 旦 ”。 它 绝对 不 是 一 套 仅仅 能 做 些 数据 存储 
的 小 软件 ， 它 是 如 同一 只 聪慧 的 大 象 般 智 能 又 强大 的 大 型 系统 。 如 有 果 你 所 需要 的 仅仅 是 一 
个 键 - 值 存 储 ， 或 者 一 个 只 要 能 装 数据 就 行 的 小 软件 ， 那 么 PostgreSQL 必定 会 远 比 你 的 
期 望 强大 百倍 。 


如 何 获取 本 书 使 用 的 数据 和 示例 代码 

可 从 本 书 的 官方 链接 (http://www.postgresonline.com/downloads/postgresql_book_2e.zip) 
获取 。 如 果 发 现 所 提供 的 数据 有 误 ， 请 将 相关 信息 发 布 到 本 书 的 勘误 页 面 (http://www. 
oreilly.com/catalog/errata.csp?isbn=0636920032144)。 
































关于 PostgreSQL 的 更 多 信息 


本 书 致力 于 展示 PostgreSQL 区 别 于 其 他 数据 库 的 独特 功能 ， 以 及 如 何 使 用 这 些 功 能 来 解 
决 现实 世界 的 问题 。 你 将 学 到 如 何 使 用 一 些 你 在 数据 库 领 域 前 所 未 见 的 方法 来 解决 问题 
除了 那些 “高 大 上 ”的 内 容 ， 我 们 也 会 向 你 展示 如 何 处 理 一 些 基本 的 任务 ， 比 如 数据 库 管 
理 、 权 限 设置 、 性 能 问题 定位 、 性 能 调 优 、 使 用 不 同 的 桌面 工具 连接 到 数据 库 、 命 令 行 操 
作 以 及 开发 工具 的 使 用 ， 等 等 。 


PostgreSQL 有 一 套 内 容 丰 富 的 在 线 文档 。 本 书 不 会 重复 这 些 文档 中 已 提供 的 信息 ， 而 是 会 
鼓励 你 去 探索 博大 精深 的 PostgreSQL 中 的 未 知 领域 。 官 方 手册 (http://www.postgresql.org/ 
docs/manuals) 目前 包含 2250 多 页 的 内 容 ， 同 时 提供 HTML 和 PDF 两 种 格式 。 此 外 ， 如 
果 你 需要 的 话 ， 最 近 几 个 版 本 的 官方 手册 还 提供 纸 质 印 刷 版 。 由 于 其 规模 庞大 ， 内 容 丰 
富 ， 纸 质 版 通常 是 分 成 3 到 4 册 提 供 的 。 


其 他 可 用 的 PostgreSQL 资源 还 包括 : 




































































。 Planet PostgreSQL (http://planet.postgresql.org) 是 PostgreSQL 技术 博客 文章 的 汇聚 
站 点 ， 其 中 包含 从 PostgreSQL 核心 开发 人 员 到 普通 用 户 编写 的 各 类 文章 ， 包 括 新 
特性 演示 以 及 对 现 有 功能 的 使 用 说 明 ， 

。 PostgreSQL Wiki (https://wiki.postgresql.org) 提供 对 PostgreSQL 各 个 方面 的 使 用 技 
巧 说 明 ， 以 及 从 其 他 数据 库 移植 到 PostgreSQL 的 方法 ; 

。 PostgreSQL Books (http:/www.postgresql.org/docs/books/) 提供 有 关 PostgreSQL 的 
书籍 列表 信息 ; 

。 PostGIS in Action Books (http://www.postgis.us/) 是 我 们 已 出 版 的 关于 PostGIS 的 
籍 的 官方 站 点 。 


代码 与 输出 格式 


对 于 括号 中 的 内 容 ， 我 们 一 般 会 将 左 括号 与 之 前 的 内 容 放 置 于 同一 行 ， 右 括号 单独 放置 一 
行 ， 以 便于 纵 栏 印刷 。 格 式 如 下 : 




















Ey 

















function ( Welcome to PostgreSQL 
); 


为 节省 版 面 ， 我 们 还 移 除 了 命令 行 执行 输出 结果 中 无 意义 的 空格 ， 因 此 如 果 发 现实 际 输出 
结果 的 格式 与 书 中 提供 的 不 一 致 ， 请 不 用 担心 ， 这 是 正常 的 。 


请 注意 ， 虽 然 我 们 建议 在 编码 时 逗号 后 要 加 一 个 空格 ， 但 本 书 中 的 确 有 些 地 方 因 版 面 宽度 
的 关系 而 去 掉 了 这 种 空格 。 


PostgreSQL 的 SQL 解释 器 会 将 语句 中 的 制 表 符 、 换 行 符 和 回 车 符 当 作 空 格 处 理 。 在 我 们 















































Te 
前 言 | xv 


提供 的 示例 代码 中 ， 一 般 会 使 用 空格 而 不 是 制 表 符 作为 缩 进 符 。 请 确保 使 用 的 代码 编辑 器 
不 会 自动 将 制 表 符 、 换 行 符 和 回 车 符 删除 ， 或 者 把 它们 转换 为 空格 以 外 的 什么 字符 ， 否 则 
会 导致 问题 。 


如 果 在 执行 示例 代码 时 遇 到 了 问题 ， 请 检查 确认 你 复制 过 来 的 代码 与 我 们 提供 的 原始 代码 
是 否 一 致 。 


注意 有 些 示例 适用 于 Linux， 而 有 些 适 用 于 Windows。 例 如 某 些 关于 外 部 数据 封装 器 的 
例子 中 要 求 使 用 带 完整 路 径 的 文件 名 ， 你 会 看 到 示例 代码 中 有 类 似 于 /postgresql_book/ 
somefile.csv 这 样 的 路 径 , 这 指 的 是 Linux 服务 器 根 目 录 下 的 路 径 。 如 果 使 用 的 是 Windows 
环境 ， 那 么 需要 加 上 驱动 器 符 ， 因 此 路 径 要 改 为 : C:/postgresql_book/somefile.csv。 请 注 
意 : 即使 是 在 Windows 上 ， 路 径 中 也 应 该 使 用 Linux 的 路 径 分 隔 符 /， 而 不 是 Windows 传 
统 的 \。 


排版 约定 


本 书 使 用 了 下 列 排版 约定 。 








。 等 宽 字 体 (constant width) 
表示 程序 片段 ， 以 及 正文 中 出 现 的 变量 、 函 数 名 、 数 据 库 、 数 据 类 型 、 环 境 变 量 、 语 
句 和 关键 字 等 。 


。 加 粗 等 宽 字 体 (constant width bold) 
表示 应 该 由 用 户 输入 的 命令 或 其 他 文本 。 


。 和 斜体 等 宽 字 体 (constant width bold) 
表示 应 替换 成 用 户 提 供 的 值 或 由 上 下 文 决定 的 值 。 











该 图 标 表 示 提 示 或 建议 。 














使 用 代码 示例 


补充 材料 〈 代 码 示例 、 练 习 等 ) 可 以 从 http:Wwww.postgresonline.com/downloads/postgresql_ 
book_2e.zip 下 载 。 


本 书 是 要 帮 你 完成 工作 的 。 一 般 来 说 ， 如 果 本 书 提供 了 示例 代码 ， 你 可 以 把 它 用 在 你 的 程 
序 或 文档 中 。 除 非 你 使 用 了 很 大 一 部 分 代码 ， 否 则 无 需 联系 我 们 获得 许可 。 比 如 ， 用 本 书 
的 几 个 代码 片段 写 一 个 程序 就 无 需 获 得 许可 ， 销 售 或 分 发 O'Reilly 图 书 的 示例 光盘 则 需要 
获得 许可 ， 引 用 本 书 中 的 示例 代码 回答 问题 无 需 获 得 许可 ， 将 书 中 大 量 的 代码 放 到 你 的 产 
品 文档 中 则 需要 获得 许可 。 


我 们 很 希望 但 并 不 强制 要 求 你 在 引用 本 书 内 容 时 加 上 引用 说 明 。 引 用 说 明 一 般 包 括 书 名 、 
作者 、 出 版 社 和 JSBN。 比 如 :“PosrgreSOL: Up and Running, Second Edition by Regina Obe 
and Leo Hsu (O’Reilly). Copyright 2015 Regina Obe and Leo Hsu, 978-1-4493-7319-1.” 














如 果 你 觉得 自己 对 示例 代码 的 用 法 超出 了 上 述 许可 的 范围 ， 欢 迎 你 通过 permissions@ 
oreilly.com 与 我 们 联系 。 








Safari2 Books Online 


Safari Books Online (http:/www.safaribooksonline.com) 是 应 

Sa fa 【上 1。 运 而 生 的 数字 图 书馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 世界 
Books Online 顶级 技术 和 商务 作家 的 专业 作品 。 技 术 专 家 、 软 件 开发 人 员 、 

Web 设计 师 、 商 务 人 士 和 创意 专家 等 ， 在 开展 调研 、 解 决 问题 、 学 习 和 认证 培训 时 ， 都 将 
Safari Books Online 视 作 获取 资料 的 首选 渠道 。 
































对 于 组 织 团体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 的 定 
价 策略 。 用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 O'Reilly Media、Prentice 
Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit 
Press、 Focal Press、Cisco Press、John Wiley & Sons、 Syngress、 Morgan Kaufmann、IBM 
Redbooks、 Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、 
Jones 多 Bartlett、Course Technology 以 及 其 他 几 十 家 出 版 社 的 上 千 种 图 书 、 培 训 视 频 和 正 
式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信息 ， 我 们 网 上 见 。 


联系 我 们 


请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 























美国 


O’Reilly Media, Inc. 
1005 Gravenstein Highway North 


S 











ebastopol, CA 95472 
区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 
上 的 相关 信息 ， 包 括 











中 国 : 








北京 市 西城 
奥 莱 利 技术 咨询 (北京 ) 有 限 公司 
网 页 ， 你 可 以 在 那儿 找到 本 


O’Reilly 的 每 一 本 书 都 有 专 局 
BB 的 网 站 地 址 是 : 


例 代 码 以 及 其 他 信息 。 本 二 
http://shop.oreilly.com/product/0636920032144.do 
会 议和 新 闻 的 信息 ， 请 访问 以 下 网 站 : 











F 到 :bookquestions @oreilly.com 
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上 、 





BB 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮 和 但 
图 书 、 培 训 课 和 








对 于 本 
要 了 解 更 多 O’Reilly 
http://www.oreilly.com 
我 们 在 Facebook 的 地 址 如 下 : http://facebook.com/oreilly 
请 关注 我 们 的 Twitter 动态 : http://twitter.com/oreillymedia 

我 们 的 YouTube 视频 地 址 如 下 : http://www.youtube.com/oreillymedia 








第 1 章 


基础 知识 





本 章 将 带 你 开始 PostgreSQL 的 探索 之 旅 。 首 先 将 介绍 如 何 下 载 和 安装 PostgreSQL， 然 后 
会 讲 到 一 些 必 备 的 管理 工具 和 PostgreSQL 术语 。 本 书写 作 之 时 ，PostgreSQL 9.4 正在 等 待 
发 布 ， 我 们 将 重点 介绍 该 版 本 的 一 些 新 特性 。 在 本 章 的 末尾 ， 我 们 将 给 出 一 些 帮 助 资源 列 
表 ， 在 遇 到 问题 时 你 可 以 从 中 获得 帮助 。 











1.1 如 何 获 得 PostgreSQL 
若干 年 前 ， 你 只 能 通过 手动 编译 源码 的 方式 来 安装 PostgresQL。 还 好 那 种 痛苦 的 时 代 已 经 
一 去 不 复 返 了 。 当 然 ， 现 在 依然 可 以 通过 编译 源码 来 安装 ， 但 大 多 数 用 户 会 使 用 制作 好 的 
安装 包 来 安装 ， 只 需 融 击 几 下 键盘 和 鼠标 就 可 以 了 ， 





如 果 你 是 首次 安装 PostgreSQL， 那 么 应 该 选择 适用 于 你 的 操作 系统 平台 的 最 新 稳定 版 发 
行 包 。PostgreSQL 官方 站 点 的 核心 发 布 页 面 上 维护 了 一 个 列表 (http:/www.postgresql.org/ 
download)， 记 录 了 适用 于 各 操作 系统 的 二 进 制 包 的 下 载 地 址 。 在 附录 A 中 ， 你 将 会 看 到 
安装 指导 和 一 些 特殊 定制 过 的 版 本 的 下 载 链 接地 址 。 


1.2 ”管理 王 基 


PostgreSQL 负 用 的 管理 工具 有 四 种 : psql、pgAdmin、phpPgAdmin 和 Adminer。PostgreSQL 
的 核心 开发 团队 维护 着 前 三 种 ， 因 此 它们 一 般 会 随 着 PostgreSQL 的 版 本 发 布 而 同步 更 新 。 
Adminer 并 非 PostgreSQL 的 专用 管理 工具 ， 它 支持 管理 多 种 类 型 的 关系 型 数据 库 ， 包 括 
SQLite、MySQL、SQL Server 和 Oracle 等 。 除 了 我 们 刚刚 提 到 的 这 四 种 以 外 还 有 大 量 优秀 



































的 管理 工具 ， 开 源 的 和 商业 的 都 有 。 


1.2.1 psql 


psql 是 一 种 用 于 执行 查询 的 命令 行 工具 ， 每 个 PostgreSQL 发 行 版 中 都 自 带 psql。 它 有 一 些 
独特 的 功能 ， 比 如 导入 或 者 导出 基于 分 隔 符 (分 隔 符 可 以 是 总 号 或 者 制 表 符 等 字符 ) 格式 
的 平面 数据 文件 ， 以 及 生成 简易 的 HTML 格式 报表 等 。psql 是 PostgreSQL 从 诞生 之 初 就 
3 ， 它 是 很 多 资深 PostgreSQL 专家 日 常 操作 工具 的 不 二 之 选 ， 非 常 适 

于 只 有 控制 台 字 符 界面 而 无 图 形 用 户 界面 的 使 用 场景 。 另 外 在 通过 shell 脚本 执行 数据 库 
pe psql 也 是 必 备 工具 。 To 户 一 般 更 喜欢 使 用 图 形 界面 工具 ， 而 且 也 无 法 理解 
为 什么 “ 老 ” 一 代 人 会 对 命令 行 方式 那么 执着 。 
























































1.2.2 pgAdmin 


pgAdmin (www.pgadmin.org) 是 一 种 广泛 使 用 的 开源 PostgreSQL 图 形 界面 管理 工具 。 如 
果 你 的 PostgreSQL 安装 包 里 没有 附带 此 工具 ， 请 从 其 官网 单独 下 载 安装 。 


pgAdmin 运行 于 图 形 化 桌面 环境 下 ， 可 以 同时 连接 到 多 个 PostgreSQL 服务 器 上 ， 这 些 服 
务 器 可 以 是 安装 在 任意 操作 系统 平台 上 的 任意 PostgreSQL 版 本 。 


即使 你 的 数据 库 安 装 在 只 有 字符 控制 台 界 面 的 Linux 服务 器 上 ， 只 要 你 在 本 地 工作 站 上 安 
装 了 pgAdmin， 也 可 以 用 这 种 强大 的 图 形 化 工具 对 其 进行 管理 。 


















































1-1 是 pgAdmin 的 界面 示意 图 。 





国 localhost 9.4 (localhost:5444) 
日 目 Databases (2) 
由 postgres 
日 -器 postgresql_book 
日 - 仿 catalogs (2 
由 -人 ANSI (information_schema) 
日 "© PostgreSQL (pg_catalog) 
由 - 叶 Aggregates (133) 
Foreign Tables (0) 
Functions (2524) 
全 Operators (765) 
ey Operator Classes (126) 
[Ea Operator Families (84) 
Sequences (0) 
局 Tables (5 
Trigger Functions (0) 
由 - 轩 Types (8 人 9 
由 Views (48) 
由 多 
内 Event Triggers (0) 
日 全 Extensions (2) 
hstore 
plpgsql 
县 Foreign Data Wrappers (0) 
由 Languages (1) 
由 - 煞 schemas (3) 
由 -局 Tablespaces (2) 
Group Roles (0) 
由 -部 , Login Roles (DD) 





围困 * 田 - 田 





田 











1-1: pgAdmin 
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如 果 你 对 PostgreSQL 还 不 太 熟 悉 ， 那 么 pgAdmin 毫 无 疑问 将 是 你 开始 PostgreSQL 学 习 之 
旅 的 最 佳 入 口 。 只 需要 在 主 界面 上 摸索 一 下 ， 你 就 可 以 对 PostgreSQL 的 丰富 功能 一 览 无 
遗 。 如 果 你 正 打算 逃离 SQL Server 阵营 ， 并 且 习 惯 于 SQL Server 的 Management Studio， 
那么 很 快 就 能 适应 pgAdmin。 

















1.2.3 phpPgAdmin 

phpPgAdmin (https://github.com/phppgadmin/phppgadmin) 是 一 种 免费 的 基于 Web 页 面 的 
管理 工具 ， 甚 界面 如 图 1-2 所 示 。 它 是 从 流行 的 MySQL 管理 工具 phpMyAdmin 移植 而 来 
的 ， 二 者 的 差别 主要 在 于 phpPgAdmin 新 增 了 对 schema、 过 程 化 语言 、 类 型 转换 器 、 运 
算 符 等 对 象 的 管理 功能 。 如 果 你 对 phpMyAdmin 很 熟悉 ， 会 发 现 phpPgAdmin 的 界面 风 
格 与 其 完全 类 似 。 







































































日 - 回 example_ db 一 
四 La 蔚 pnppgadmin: 国 postgresat 9.1°: 国 axampte_ db?: 















































日 - 倪 Schemas 
© information_schema | 全 A 种 = EE a 
© pg_catalog Schemas? SQL? Find Varisbles’ Processes’ Lods’” Aimin prvileges’” Lsngusages” Cas 
© pg toast temp 1 上 
ED--@ public information_schema postgres Drop | Privieges | Alter 
凯 Tables 
A pg_catalog postgres Drop | Prvieges | Alter | System catalog schema 
同 Views -一 
二 Se 三 pg_toast temp_1 postgres Drop | Privieges | Alter 
由 三 
念 Functions 回 public postgres Drop | Privilegss | Alter | standard publicschema 
篇 Full Text Search 
命 Domains Actions on multiple lines 
网 Aggregates Select all / Unselect all 一 > 一 v | Execute 
加 Types 
| Create schema 








仿 Operators 
鸭 Op Classes 


图 1-2: phpPgAdmin 











1.2.4 Adminer 


如 果 你 正在 寻找 一 款 除了 能 够 管理 PostgreSQL， 还 能 管理 别 的 数据 库 的 整合 型 工具 ， 那 么 
Adminer (http:/www.adminer.org/) 将 是 你 合适 的 选择 。Adminer 是 一 款 轻 量 级 的 开源 PHP 
应 用 程序 ， 可 以 在 同一 套图 形 界面 上 管理 PostgreSQL、MySQL、SQLite、SQL Server 以 及 
Oracle 等 多 种 数据 库 。 


Adminer 有 一 种 独特 的 功能 让 我 们 印象 深刻 : 它 能 够 以 图 形 化 方式 展示 数据 库 中 的 对 象 ， 
并 将 外 键 约束 关系 以 连接 线 的 方式 展示 出 来 。 另 外 ， 整 个 Adminer 程序 的 本 体 仅 包含 一 个 
PHP 文件 ， 非 常 简洁 ， 这 可 以 大 大 减少 你 安装 部 署 时 的 麻烦 。 


















































图 1-3 中 ， 左 侧 是 登录 屏幕 的 截图 ， 右 侧 是 表 间 关系 图 形 化 后 呈现 的 效果 。 很 多 用 户 会 因 
为 登录 屏幕 上 没有 填写 端口 号 的 地 方 而 感到 困惑 。 如 果 PostgreSQL 使 用 标准 的 5432 侦 听 
端口 ， 那 么 登录 时 不 填 也 没 问 题 ， 但 如 果 不 是 ， 那 么 就 需要 在 服务 器 名 称 后 面 加 上 端口 
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号 ， 注 意 用 冒号 分 隔 主 机 名 和 端口 号 ， 如 图 1-3 所 示 。 

















System | PostgreSQL ~ lu fact types 
| fact_type_id 
Server | localhost5432 








category 
fact_subcats 
short_name 


Username | postgres 





Password eeeeeeeeeee 


Database | postgresql_book 








fact_type_id 
i 回 p jb tract_id 
gin ermanent login i yr 
tract_id val 
tract_long_id perc 
tract_name 











1-3: Adminer 


对 于 简单 的 查询 和 修改 操作 来 说 ，Adminer 的 功能 是 足够 的 。 但 为 了 支持 多 种 数据 库 ， 
Adminer 的 功能 体系 已 经 被 裁剪 成 了 各 数据 库 均 支持 的 最 小 公共 集合 ， 因 此 你 无 法 实现 
PostgreSQL 所 特有 的 一 些 操 作 ， 比 如 创建 新 用 户 、 授 予 权 限 或 者 是 查询 当前 权限 列表 等 。 
如 果 你 是 DBA， 那 么 建议 使 用 pgAdmin， 当 然 也 可 以 安装 一 套 Adminer 以 备 不 时 之 需 。 


1.3 ”PostgreSQL 数 据 库 对 和 象 


假设 你 现在 已 经 安装 好 了 PostgreSQL， 请 启动 并 连接 好 pgAdmin， 然 后 点 开 左 侧 的 目录 
树 ， 此 时 展现 在 你 面前 的 是 一 堆 令 人 眼花 练 乱 的 数据 库 对 象 ， 有 些 你 可 能 很 熟悉 ， 有 些 则 
可 能 闻所未闻 。PostgreSQL 对 象 类 型 的 数量 超过 了 绝 大 多 数 关 系 型 数据 库 (这 还 是 在 未 安 
装 任何 扩展 包 的 情况 下 )。 这 些 对 象 中 ， 有 许多 你 可 能 永远 都 不 会 用 到 ， 但 如 果 你 发 现 业 
务 上 需要 实现 一 种 新 的 对 象 类 型 ， 那 么 一 般 来 说 你 要 实现 的 东西 在 那 一 堆 眼 花 综 乱 的 对 象 
中 已 经 有 前 人 实现 过 了 ， 所 以 只 需要 正确 选用 即 可 。 本 书 不 会 介绍 PostgreSQL 以 标准 方式 
安装 完毕 后 所 提供 的 所 有 对 象 类 型 ， 因 为 PostgreSQL 引入 新 特性 的 速度 惊人 ， 任 何 一 本 书 
都 不 可 能 全 面 覆 盖 所 有 对 象 类 型 。 因 此 我 们 仅 讨 论 你 有 必要 了 解 的 那些 对 象 类 型 。 


。 服务 

在 大 多 数 操作 系统 上 ，PostgreSQL 是 作为 一 种 服务 (或 者 叫 守 护 进 程 ) 安装 的 。 多 个 
PostgreSQL 服务 可 以 运行 于 同一 台 物 理 服务 器 上 ， 但 它们 的 侦 听 端口 不 能 重复 ， 也 不 
能 共享 同一 个 数据 存储 目录 。 本 书 中 ，server (服务 器 ) 和 service (服务 ) 这 两 个 术语 
可 互 换 使 用 ， 因 为 大 多 数 人 在 一 台 物 理 服务 器 上 只 会 安装 一 个 服务 。 






















































































。 database! 
每 个 PostgreSQL 服务 可 以 包含 多 个 独立 的 database。 








注 1: database 一 词 含义 宽泛 ， 既 可 表示 广义 的 数据 库 系 统 ， 又 可 以 表示 某 些 特定 数据 库 系 统 中 的 某 一 级 数 
据 存储 单位 ， 如 表述 不 当 极 易 给 读者 造成 混淆 。 因 此 本 书 中 会 区 别 使 用 ， 表 示 广 义 的 数据 库 系 统 时 ， 
用 中 文 “ 数 据 库 ”， 表 示 狭 义 的 数据 存储 单位 时 ， 用 英文 “database”。 一 一 译 者 注 
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Schema 

ANSI SQL 标准 中 对 schema 有 着 明确 的 定义 ，database 的 下 一 层 逻 辑 结 构 就 是 schema。 
如 果 把 database 比 作 一 个 国家 ， 那 么 schema 就 是 一 些 独 立 的 州 (或 者 是 省 、 府 、 辖 区 
等 ， 具 体 取 决 于 各 国 的 实际 情况 )。 大 多 数 对 象 是 隶属 于 某 个 schema 的 ， 然 后 schema 
又 隶属 于 某 个 database。 在 创建 一 个 新 的 database 时 ，PostgreSQL 会 自动 为 其 创建 一 个 
名 为 public 的 schema。 如 果 未 设置 search_path 变量 (后 续 会 介绍 该 变量 的 含义 )， 那 
么 PostgreSQL 会 将 你 创建 的 所 有 对 象 默认 放 入 public schema 中 。 如 果 表 的 数量 较 少 ， 
这 是 设 问题 的 ， 但 如 果 你 有 几 千 张 表 ， 那 么 我 们 还 是 建议 你 将 它们 分 门 别 类 放 入 不 同 的 


schema 中 。 














catalog’ 
catalog 是 系统 级 的 schema， 用 于 存储 系统 函数 和 系统 元 数据 。 每 个 database 创建 好 
以 后 默认 都 会 含有 两 个 catalog: 一 个 名 为 pg_catalog， 用 于 存储 PostgreSQL 系统 自 
带 的 函数 、 表 、 系 统 视图 、 数 据 类 型 转换 器 以 及 数据 类 型 定义 等 元 数据 ， 另 一 个 是 
information_schema， 用 于 存储 ANSI 标准 中 所 要 求 提供 的 元 数据 查询 视图 ， 这 些 视 图 
遵从 ANSI SQL 标准 的 要 求 ， 以 指定 的 格式 向 外 界 提 供 PostgreSQL 元 数据 信息 。 


一 直 以 来 ，PostgreSQL 数据 库 的 发 展 都 严格 地 遵循 着 其 “自由 与 开放 ”的 核心 理念 。 
如 果 你 足够 了 解 这 款 数 据 库 ， 会 发 现 它 儿 乎 是 一 种 可 以 “自我 生长 ”的 数据 库 。 比 如 ， 
它 所 有 的 核心 设置 都 保存 在 系统 表 中 ， 用 户 可 以 不 受 限 地 查看 和 修改 这 些 数 据 ， 这 为 
PostgreSQL 提供 了 远 超 任何 一 种 商业 数据 库 的 巨大 灵活 性 〈 不 过 从 另 一 个 角度 看 ， 将 
这 种 灵活 性 称 为 “可 破坏 性 ”也 未 党 不 可 )。 只 要 仔细 地 研究 一 下 pg_catalog， 你 就 可 
以 了 解 到 PostgreSQL 这 样 一 个 庞大 的 系统 是 如 何 基 于 各 种 部 件 构 建 起 来 的 。 如 果 你 有 
超级 用 户 权限 ， 那 么 可 以 直接 修改 pg_catalog 的 内 容 (当然 ， 如 果 改 得 不 对 ， 那 你 的 
行为 就 跟 搞 破坏 没什么 两 样 了 )。 












































Information_schema catalog 在 MySQL 和 SQL Server 中 也 有 。PostgreSQL Information_ 
schema 中 最 常用 的 视图 一 般 有 以 下 几 个 : coLumns 视图 ， 列 出 了 数据 库 中 的 所 有 表 列 ; 
tables 视图 ， 列 出 了 数据 库 中 的 所 有 表 (包括 视图 ) ;views 视图 ， 列 出 了 所 有 视图 以 
及 用 于 构建 或 重新 构建 该 视图 的 关联 SQL。 同 样 ， 在 MySQL 和 SQL Server 中 也 有 这 
些 视图 ， 不 过 它们 所 含 的 列 没有 PostgreSQL 那么 多 。PostgreSQL 另外 添加 了 几 个 用 于 
描述 自 定 义 数 据 类 型 列 的 列 ， 比 如 columns .udt_name。 








































































































上 2; 数据 库 业界 对 于 schema 有 多 种 译 法 : 纲要 、 模 式 、 方 案 ， 等 等 。 但 各 种 译 法 都 不 能 准确 直观 地 表达 
































出 其 原本 的 含义 ， 即 位 于 一 个 独立 命名 空间 内 的 一 组 相关 数据 库 对 象 的 集合 ， 因 此 前 述 译 法 从 来 没有 
一 种 成 为 主流 。 一 般 业 界 人 员 都 直接 使 用 英文 schema。 考 虑 到 这 个 情况 ， 为 防止 初级 用 户 理解 困难 ， 
我 们 也 按照 业界 习惯 直接 使 用 英文 原名 。 一 一 译 者 注 






























































主 3: catalog 的 译 法 与 schema 存在 相同 的 问题 ， 翻 译 为 “目录 ”后 并 不 能 让 读者 准确 地 理解 其 原意 ， 反 而 














容易 造成 混淆 ， 因 此 还 是 沿用 英文 原名 。 一 一 译 者 注 
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尽管 columns、tables、views 这 三 个 元 数据 视图 本 身 也 是 标准 的 PostgreSQL 视图 ， 但 
由 于 其 身份 的 特殊 性 ，pgAdmin 界面 中 还 是 把 它们 放 在 了 information_schema 一 Catalog 
Objects 分 支 下 。 








变量 

变量 是 PostgreSQL 统一 配置 机 制 (GUC) 的 一 部 分 ， 是 可 以 在 多 个 级 别 进 行 设 置 的 各 
种 选项 ， 这 些 级 别 包括 服务 级 、database 级 以 及 其 他 级 别 。 很 多 人 容易 在 search_path 
这 个 选项 上 犯错 ， 该 选项 的 工作 机 制 是 : 如 果 在 search_path 中 指定 了 schema 的 名 称 ， 
那么 该 schema 资产 在 使 用 时 就 无 需 显 式 指定 其 schema 名 ， 系 统 会 按照 search_path 中 
登记 的 schema 名 按 顺 序 逐 个 搜索 。2.4.2 节 会 对 search_path 进行 详细 讨论 。 











扩展 包 

PostgreSQL 9.1 版 中 引入 了 对 于 扩展 包机 制 的 支持 。 开 发 人 员 可 以 通过 该 机 制 将 一 组 相 
关 的 函数 、 数 据 类 型 、 数 据 类 型 转换 器 、 用 户 自 定义 索引 、 表 以 及 GUC 等 对 象 打包 成 
一 个 功能 扩展 包 ， 该 扩展 包 可 以 整体 安装 或 者 整体 删除 。 扩 展 包 在 概念 上 与 Oracle 的 
package 类 似 ， 一 般 推 荐 使 用 该 机 制 来 为 数据 库 提 供 功能 扩展 。 关 于 扩展 包 的 具体 安装 
步骤 ， 请 参考 开发 手册 。 一 般 来 说 需要 先 将 扩展 包 的 二 进 制 安装 包 和 脚本 复制 到 服务 
器 ， 然 后 再 为 需要 该 扩展 包 功 能 的 database 单独 安装 。 












































假设 你 需要 用 到 某 个 扩展 包 的 功能 ， 那 么 仅 需 将 其 安装 到 对 应 的 database 中 即 可 ， 而 不 
必 为 当前 数据 库 系 统 中 的 每 个 database 都 安装 一 遍 。 比 如 需要 对 某 个 database 中 的 数据 
进行 高 级 文本 搜索 ， 那 么 单独 为 该 database 安装 fuzzystrmatch 扩展 包 即 可 。 安 装 扩展 
包 时 可 以 指定 装 到 哪个 shema， 若 不 指定 则 默认 会 装 到 public schema 中 。 我 们 不 建议 
这 么 做 ， 因 为 这 会 导致 public schema 变 得 庞大 复杂 且 难 以 管理 ， 尤 其 是 如 果 你 将 自己 
的 数据 库 对 象 也 都 存 入 public schema 中 ， 那 么 情况 会 变 得 更 糟糕 。 我 们 建议 你 创建 一 
个 独立 的 schema 用 于 存放 所 有 扩展 包 的 对 象 ， 其 至 为 规模 较 大 的 扩展 包 单 独创 建 一 个 
schema。 为 避免 出 现 找 不 到 新 增 扩 展 包 对 象 的 问题 ， 请 将 这 些 新 增 的 schema 名 称 加 入 
search_path 变量 中 ， 这 样 就 可 以 直接 使 用 扩展 包 的 功能 而 无 需 关注 它 到 底 装 到 了 哪个 
schema 中 。 也 有 一 些 扩展 包 明 确 要 求 必须 安装 到 某 个 schema 下 ， 这 种 情况 下 你 就 不 能 
自行 指定 了 。 例 如 有 很 多 语言 扩展 包 ， 比 如 plv8， 就 要 求 必须 安装 到 pg_catalog 中 。 


表 
任何 一 个 数据 库 中 ， 表 都 是 最 核心 和 最 “忙碌 ”的 对 象 类 型 。 在 PostgreSQL 中 ， 表 首 
先 属于 某 个 schema， 而 Schema 又 属于 某 个 database， 这 样 就 构成 了 一 种 三 级 存储 结构 。 


PostgreSQL 的 表 支 持 两 种 很 强大 的 功能 。 第 一 种 是 表 继 承 ， 即 一 张 表 可 以 有 父 表 和 子 
表 。 这 种 层次 化 的 结构 可 以 极 大 地 简化 数据 库 设计 ， 还 可 以 为 你 省 掉 大 量 的 重复 查询 代 
码 。 我 们 将 在 本 书后 面 的 示例 6-2 中 介绍 表 继 承 机 制 。 












































第 二 种 是 创建 一 张 表 的 同时 ， 系 统 会 自动 为 此 表 创 建 一 种 对 应 的 自 定义 数据 类 型 。 换 句 
话说 ， 你 可 以 将 某 个 完整 的 数据 结构 定义 为 一 个 表 ， 然 后 将 该 表 用 作 另 一 个 表 中 的 一 个 
列 。 关 于 这 种 复合 数据 类 型 的 更 多 细 闻 ， 请 参见 5.8 市 。 


外 部 表 和 外 部 数据 封装 器 

外 部 表 的 首次 亮相 是 在 9.1 版 中 。 它 们 是 一 些 虚拟 表 ， 通 过 它们 可 以 直接 在 本 地 数据 
库 中 访问 来 自 外 部 数据 源 的 数据 。 只 要 数据 映射 关系 配置 正确 ， 那 么 外 部 表 的 用 法 就 
与 普通 表 没 有 任何 区 别 。 外 部 表 支 持 映 射 到 以 下 类 型 的 数据 源 ，CSYV 文件 、 另 一 个 
服务 器 上 的 PostgreSQL 表 、SQL Server 或 Oracle 这 些 异 构 数据 库 中 的 表 、Redis 这 样 
的 NoSQL 数据 库 或 者 甚至 像 Twitter 或 Salesforce 这 样 的 Web 服务 。 外 部 表 映 射 关 系 
的 建立 是 通过 配置 外 部 数据 封装 器 (Foreign Data Wrapper，FDW) 实现 的 。FDW 是 
PostgreSQL 和 外 部 数据 源 之 间 的 一 架 “ 魔 法 桥 "， 可 实现 两 边 数 据 的 互联 互通 。 其 内 部 
实现 机 制 遵循 SQL 标准 中 的 MED (Management of External Data) 规范 ， 更 多 细节 请 参 
考 维基 百科 上 关于 MED 的 描述 (http://en.wikipedia.org/wiki/SQL/MED)。 


许多 编程 人 员 已 经 为 当下 绝 大 部 分 流行 的 数据 源 开发 了 FDW 并 已 免费 共享 出 来 。 你 
可 以 通过 创建 自己 的 FDW 来 练习 。( 我 们 建议 你 一 旦 成 功 了 也 公布 出 来 ， 这 样 整 个 社 
区 都 可 以 分 享 你 的 劳动 成 果 。) FDW 是 通过 扩展 包机 制 实 现 的 ， 装 好 以 后 在 pgAdmin 
界面 上 名 为 Foreign Data Wrapper 的 目录 市 点 下 能 看 到 它 。 





















































空间 
表 空 间 是 用 于 存储 数据 的 物理 空间 。PostgreSQL 将 用 于 物理 存储 的 表 空 间 和 用 于 逻辑 
存储 的 schema 分 开 管理 ， 二 者 之 间 并 无 而 合 关 系 。 这 样 就 很 容易 在 不 影响 业务 应 用 区 
辑 的 情况 下 ， 将 database 甚至 是 单 张 表 和 索引 在 不 同 的 物理 驱动 器 之 间 进 行 移 动 。 





























视图 

大 多 数 关系 型 数据 库 都 支持 视图 ， 通 过 视图 可 以 大 大 简化 复杂 的 查询 逻辑 ， 另 外 也 可 以 
通过 对 视图 执行 更 新 操作 来 修改 其 基 表 数据 。PostgreSQL 也 不 例外 ， 从 9.3 版 开始 支持 
对 基于 单 表 的 视图 直接 使 用 SQL 进行 更 新 操作 ， 这 样 就 不 需要 再 写 额 外 的 规则 或 者 触 
发 器 来 实现 对 此 类 简单 视图 的 更 新 。 但 对 于 包含 更 复杂 逻辑 的 视图 ， 或 者 是 基于 多 张 表 
的 视图 ， 对 其 进行 数据 更 新 操作 时 仍 需 编写 规则 或 者 触发 器 。9.3 版 还 引入 了 对 物化 视 
图 的 支持 ， 该 机 制 通过 对 视图 数据 进行 缓存 来 实现 对 常用 查询 的 加 速 。 更 多 细节 请 参见 
Tl 
















































































PostgreSQL 中 函数 执行 后 的 返回 结果 可 以 是 一 个 标量 值 或 儿 个 记录 和 集 。 可 以 在 函数 中 
对 表 数 据 进 行 修改 ， 其 他 数据 库 对 于 这 种 会 修改 表 记 录 的 函数 一 般 称 为 存储 过 程 。 











函数 是 以 过 程 化 语言 (Procedural Language，PL) 编写 的 。PostgreSQL 默认 支持 三 
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种 内 置 编程 语言 : SQL、PLpgSQL 以 及 C 语 言 。 可 以 通过 CREATE EXTENSION 或 者 
CREATE PRODCEDURAL LANGUAGE 命令 来 安装 其 他 语言 包 。 目 前 较 常 用 的 语言 有 Python、 
JavaScript、Perl 以 及 R。 第 8 章 中 有 大 量 的 相关 示例 。 





二 


运 苦 符 

运算 符 本 质 上 是 符号 化 的 已 命名 函数 【例如 =、8 等 )， 它 需要 一 个 或 者 两 个 实 参 
(argument)， 底 层 有 一 个 相应 的 函数 来 实现 其 运算 逻辑 。PostgreSQL 支持 自 定义 运算 
符 。 如 果 你 定义 了 自己 的 数据 类 型 ， 那 么 可 定义 一 些 运算 符 来 与 之 配合 工作 。 比 如 可 以 
为 自 定义 数据 类 型 定义 = 运算 符 。 你 甚至 可 以 为 两 个 完全 不 同 的 数据 类 型 定义 一 个 运算 
符 ， 来 对 其 进行 比较 运算 。 


数据 类 型 (或 者 仅仅 类 型 ) 

每 种 数据 库 产 品 都 会 支持 一 系列 的 数据 类 型 ， 比 如 整 型 、 字 符 型 、 数 组 ， 等 等 。 除 前 述 
常见 类 型 外 ，PostgreSQL 还 支持 复合 数据 类 型 ， 这 种 类 型 可 以 是 多 种 数据 类 型 的 一 个 
组 合 ， 比 如 虚数 、 极 坐标 、 张 量 都 是 复合 数据 类 型 。 如 果 你 定义 了 自己 的 复合 数据 类 
型 ， 那 么 可 以 创建 一 组 函数 和 运算 符 来 配合 它 工 作 ， 可 以 做 得 很 专业 ， 很 复杂 ， 很 “高 
端 "， 比 如 自 定义 实现 div ( 散 度 运算 )、grad (梯度 运算 ) 和 curts ( 旋 度 运算 ) 等 。 
哪 位 读者 若 有 兴趣 ， 可 以 试 一 下 。 























数据 类 型 转换 器 

cast 是 数据 类 型 转换 器 ， 就 是 将 一 种 数据 类 型 转换 为 男 一 种 类 型 的 工具 。 转 换 器 在 其 底 
层 其 实 是 通过 调用 转换 函数 来 实现 真正 的 转换 逻辑 的 。PostgreSQL 的 独到 之 处 在 于 支 
持 用 户 自 定义 转换 器 ， 这 样 就 可 以 改变 系统 默认 的 转换 行为 。 例 如 ， 如 果 你 需要 把 邮政 
编码 (美国 的 邮政 编码 是 一 个 5 位 的 整数 ) 从 integer 转换 为 character， 那 么 可 以 自 
定义 一 个 支持 “数字 不 足 5 位 则 前 面 自动 补 0” 规 则 的 转换 器 。 转 换 器 可 以 被 隐 式 调用 
也 可 以 被 显 式 调用 。 隐 式 转换 是 系统 自动 执行 的 ， 一 般 来 说 ， 将 一 种 特定 数据 类 型 转 为 
更 通用 的 数据 类 型 (比如 数字 转换 为 字符 串 ) 时 就 会 发 生 隐 式 类 型 转换 。 如 果 进 行 隐 式 
转换 时 系统 找 不 到 合适 的 转换 器 ， 你 就 必须 显 式 执行 转换 动作 。 






































序列 

序列 控制 serial 数据 类 型 的 自动 递增 。 在 PostgreSQL 中 定义 serial 列 时 ，PostgreSQL 会 
自动 创建 序列 ， 但 你 很 容易 更 改 初始 值 、 增 量 和 下 一 个 值 。 因 为 序列 是 独立 对 象 ， 所 以 
多 个 表 可 以 使 用 同一 个 序列 对 象 。 这 样 你 可 以 创建 跨越 多 个 表 的 独特 键 值 。SQL Server 
和 Oracle 也 都 有 序列 对 象 ， 但 必须 手动 创建 。 














行 或 记录 

本 书 中 ,“ 行 ”和 “记录 ”这 两 个 术语 可 互 换 使 用 。 在 PostgreSQL 中 ,“ 记 录 ” 这 个 概 
念 可 以 脱离 表 而 独立 存在 。 当 你 在 函数 或 者 在 SQL 语句 中 使 用 记录 构造 函数 语法 ( 语 
法 类 似 于 : SELECT ROW(1,2.5,'this is a test')) 时 ,会 对 这 一 点 有 深刻 体会 。 
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。 触发 器 
绝 大 多 数 企业 级 数据 库 都 支持 触发 右 机 制 ， 该 机 制 可 以 实现 对 数据 修改 事件 的 捕获 ， 并 
在 之 后 触发 用 户 自 定义 的 操作 行为 。 触 发 器 的 触发 时 机 是 可 设置 的 ， 可 以 是 语句 级 触发 
或 者 记录 级 触发 ， 可 以 是 修改 前 触发 也 可 以 是 修改 后 触发 。 


PostgreSQL 的 触发 器 技术 正在 快速 的 演进 之 中 。9.0 版 引入 了 对 WITH 子 句 的 支持 ， 通 
过 它 可 以 实现 带 条 件 的 记录 级 触发 ， 即 只 有 当 某 条 记录 符合 指定 的 WHEN 条 件 时 ， 触 
发 器 才 会 被 调用 。9.0 版 还 引入 了 UPDATE OF 子 句 ， 通 过 它 可 以 指定 要 监控 哪些 列 的 更 
改 。 当 列 更 改 时 ， 就 会 触发 触发 器 ， 详 情 请 参见 第 8 章 中 的 示例 8-11。 在 9.1 版 中 ， 
视图 中 的 数据 更 改 可 以 触发 触发 器 。 在 9.3 版 中 ， 数 据 定义 语言 (DDL) 事件 可 以 触 
发 触发 器 。 目 前 支持 触发 器 的 DDL 命令 列表 请 参见 官方 手册 中 “触发 器 触发 时 机 一 
览 表 ”(http://www.postgresql.org/docs/9.4/interactive/event-trigger-matrix.html)。 在 9.4 
版 中 ， 针 对 外 部 表 的 触发 器 也 获得 了 支持 。 请 参考 官方 文档 中 “创建 触发 器 ”(http:// 
www.postgresql.org/docs/current/interactive/sql-createtrigger.html) 这 一 节 的 内 容 以 获取 
更 多 信息 。 


下 




















。 规则 
规则 是 一 种 能 够 将 一 种 动作 替换 为 另 一 种 动作 的 机 制 。PostgreSQL 内 部 就 是 使 用 此 机 
制 来 实现 视图 的 。 比 如 我 们 定义 了 这 样 一 个 视图 : 




















CREATE VIEW vw_pupils AS SELECT * FROM pupils WHERE active; 





实际 上 PostgreSQL 在 后 台 自 动 创建 了 一 个 INSTEAD OF SELECT 类 型 的 规则 ， 其 内 容 是 : 当 
查询 名 为 ww_pupils 的 表 时 ， 自 动 重 定向 为 查询 pupils 表 中 active 字段 值 为 true 的 记录 。 





规则 还 可 以 用 于 替代 一 些 特定 的 简单 触发 器 。 通 常情 况 下 ， 在 对 记录 行进 行 更 新 /插入 / 
删除 操作 时 会 调用 触发 器 。 规 则 却 不 一 样 ， 它 的 运作 机 理 是 修改 用 户 原 本 的 行为 逻辑 (也 
就 是 你 执行 的 SQL 语句 本 身 )， 或 者 是 在 用 户 原 有 逻辑 的 基础 上 额外 附加 一 些 SQL 逻 
辑 。 相 比 触 发 器 而 言 ， 这 种 整体 取而代之 的 方式 避免 了 针对 每 条 记录 都 调用 一 次 触发 器 
所 造成 的 负担 。 一 般 来 说 ， 如 果 你 希望 在 数据 修改 时 加 载 自 定义 逻辑 ， 我 们 还 是 推荐 使 
用 触发 器 而 不 是 规则 。 很 多 PostgreSQL 用 户 认为 规则 是 过 时 的 技术 ， 因 为 出 问题 时 很 
难 诊断 ， 而 且 规则 只 支持 用 SQL 语法 来 编写 ，PostgreSQL 所 支持 的 其 他 编程 语言 则 无 
用 武之 地 。 


1.4 最 新 版 本 的 PostgreSQL 中 引入 的 新 特性 


PostgreSQL 的 版 本 发 布 是 很 有 规律 的 ， 每 年 的 9 月 份 会 发 布 一 个 大 版 本 。 每 个 新 版 本 都 会 
带 来 易 用 性 、 稳 定性 、 安 全 性 、 性 能 等 方面 的 提升 ， 以 及 一 些 试验 性 质 的 功能 。 而 且 版 本 
升级 过 程 也 变 得 越 来 越 简单 。 那 么 显而易见 ， 请 尽量 把 你 的 数据 库 及 时 升级 到 最 新 的 稳定 






















































































基础 知识 | 9 


版 。 关 于 每 个 版 本 引入 的 关键 特性 列表 ， 请 参见 官方 提供 的 “PostgreSQL 各 版 本 功能 特性 


一 览 表 ”(http:Wwww.postgresql.org/about/featurematrix ) 。 


1.4.1 为 什么 要 升级 

如 果 你 正在 使 用 PostgreSQL 8.4 或 者 更 早期 的 版 本 ， 请 立即 升级 ! 因为 8.4 版 在 2014 年 7 
月 已 进入 生命 周期 终结 (End of Life，EOL) 状态 ， 此 后 不 再 提供 官方 的 升级 支持 。 请 参 
学 PostgreSQL 官方 的 发 行 版 支持 策略 (http://www.postgresql.org/support/versioning/) 以 获 
取 更 多 关于 PostgreSQL EOL 政策 的 细节 。 请 务必 不 要 使 用 已 过 了 EOL 期 限 的 版 本 ， 因 为 
开发 组 不 会 再 为 其 提供 新 的 安全 更 新 和 功能 补丁 。 一 旦 这 种 老 版 本 出 了 问题 ， 你 只 能 花 钱 
去 请 PostgreSQL 专家 级 顾问 来 解决 故障 或 寻找 临时 解决 方案 ， 这 种 服务 一 般 都 是 很 昂贵 
的 ， 而 且 你 不 一 定 能 找 得 到 这 种 专家 。 


























不 管 当前 使 用 的 是 哪个 大 版 本 ， 你 都 应 该 尽快 跟 进 小 版 本 号 的 更 新 。 比 如 从 8.4.17 升级 到 
8.4.21， 只 需要 替换 二 进 制 文件 并 重启 一 下 即 可 。 小 版 本 仅 修改 bug 而 不 会 涉及 功能 变化 ， 
因此 这 种 升级 是 很 安全 的 ， 也 会 为 你 降低 出 问题 的 几率 。 














1.4.2 PostgreSQL 9.4 版 中 引入 的 新 特性 
本 书写 作 期 间 ，PostgreSQL 9.3 是 最 新 的 稳定 发 行 版 ，9.4 还 只 是 测试 版 ， 但 其 安装 包 已 可 
下 载 用 于 测试 。9.4 测试 版 包含 以 下 特性 。 


。 物化 视图 特性 的 改进 。 在 9.3 版 中 ， 刷 新 物化 视图 期 间 会 对 其 加 锁 并 禁止 访问 。 但 一 般 
来 说 刷新 物化 视图 会 需要 一 定 的 时 间 ， 因 此 在 生产 环境 中 该 刷新 动作 会 导致 物化 视图 可 
用 性 显著 降低 。9.4 版 中 取消 了 刷新 时 的 加 锁 动作 ， 因 此 即使 是 正在 被 刷新 的 物化 视图 
也 可 被 访问 。 但 请 注意 : 利用 此 特性 的 前 提 是 物化 视图 必须 要 拥有 一 个 唯一 索引 。 

。 新 增 了 对 SQL:2008 标准 中 规定 的 percentile_disc (不 连续 百分比 ) 和 percentile_ 
cont (连续 百分比 ) 这 两 个 分 析 函 数 的 支持 , 须 配 合 WITHIN GROUP (ORDER BY...) 子 名 
使 用 。 详 细 例 子 可 参见 depesz 博客 网 站 的 一 篇 关于 ORDERED SET WITHIN GROUP 
聚合 运算 的 介绍 文章 (http://www.depesz.com/2014/01/11/waiting-for-9-4-support-order 
ed-set-within-group-aggregates/) 。 这 些 国 数 为 你 提供 了 系统 原生 的 快速 取 中 间 值 功能 。 
例如 ， 如 果 我 们 希望 从 一 批 考 试 成 绩 中 取 中 间 点 到 3/4 处 部 分 的 值 ， 可 执行 以 下 查询 : 










































































SELECT subject，percentiLe_cont(ARRAY[0.5，0.75]) 
WITHIN GROUP (ORDER BY score) As med_75_score 
FROM test_scores GROUP BY subject; 


在 PostgreSQL 中 ， 要 实现 percentile_cont 和 percentile_disc， 可 以 取 一 个 数组 或 0 
到 1 之 间 的 单个 值 ( 此 值 代表 所 希望 查询 的 百分比 范围 )， 并 且 此 实现 会 相应 地 返回 一 
个 值 数组 或 单个 值 。 语 句 中 的 ORDER BY score 表示 希望 根据 score 字段 的 值 来 进行 百 
分 比 计算 。 
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创建 视图 时 支持 WITH CHECK OPTION 子 句 ， 其 作用 是 确保 在 视图 上 执行 更 新 或 者 插入 操 
作 时 ， 修 改 后 或 者 新 插入 的 记录 仍然 是 在 本 视图 可 见 范 围 内 。 详 见 第 7 章 中 的 示例 7-2。 
新 增 对 jsonb 数据 类 型 的 支持 ， 该 数据 类 型 是 JSON (JavaScript Object Notation) 类 
型 的 二 进 制 存储 版 本 ， 并 且 支 持 索 引 。 通 过 jsonb 类 型 可 以 对 JSON 格式 的 文档 数据 
建立 索引 ， 并 可 加 快 对 其 内 部 元 素 的 访问 速度 。 详 细 信息 请 参考 5.6 节 ， 同 时 可 参考 
这 两 篇 博客 文章 :“ 引 入 新 的 jsonb 数据 类 型 : JSON 类 型 的 结构 化 存储 格式 ”(http:/ 
www.depesz.com/2014/03/25/waiting-for-9-4-introduce-jsonb-a-structured-format-for-storing- 
json/) 以 及 “jsonb: 通配符 查询 ”(http://obartunov.livejournal.com/177977.html)。 

GIN 索引 的 查询 速度 提升 ,同时 占用 空间 减少 。GIN 索引 的 使 用 范围 日 益 广泛 ， 并 且 
非常 适用 于 全 文 搜 索 、 三 连词 处 理 、hstore 键 值 数 据 库 以 及 jsonb 类 型 支持 等 场景 。 在 
很 多 情况 下 你 其 至 可 以 把 它 当 作 B- 树 索引 的 一 个 替代 品 ， 而 且 一 般 来 说 GIN 索引 占用 
的 空间 会 更 少 。 详 情 请 参见 “使 用 GIN 索引 来 代替 位 图 索引 ”这 篇 文章 的 介绍 (http:// 
hlinnaka.iki.fi/2014/03/28/gin-as-a-substitute-for-bitmap-indexes ) 。 

支持 更 多 JSON 函数 。 请 参见 Depesz 博客 站 的 文章 "9.4 版 中 的 新 JSON 函数 介绍 ”(http:// 
www.depesz.com/2014/01/30/waiting-for-9-4-new-json-functions/) 。 

支持 使 用 以 下 语法 轻松 地 将 所 有 资产 从 一 个 表 空 间 移动 到 另 一 个 表 空 间 中 : ALTER 
TABLESPACE old_space MOVE ALL TO new_space;, 

支持 对 返回 的 结果 集中 的 记录 加 上 数字 编号 。 当 我 们 从 数组 、hstore、 复 合 类 型 等 格式 
数据 源 中 取出 非 格 式 化 数据 时 ， 由 于 缺少 可 用 于 唯一 标识 记录 的 主键 ， 因 此 一 般 需要 为 
每 条 记录 加 一 个 数字 型 的 行 号 。 现 在 可 以 将 系统 列 ordinality (该 列 是 在 ANSI SQL 标 
准 中 定义 的 ) 添加 到 输出 。 以 下 是 一 个 使 用 hstore 对 象 以 及 返回 一 个 键 值 对 的 each 函 
数 的 例子 : 

























































































SELECT ordinality, key, value 
FROM each('breed=>pug,cuteness=>high'::hstore) NITH ordinality; 


支持 通过 执行 SQL 命令 来 更 改 系 统 配 置 设置 。ALTER system SET ... 语法 可 实现 对 全 
局 系统 设置 的 动态 修改 ， 这 一 功能 在 之 前 版 本 中 只 能 通过 修改 postgresql.conf 文件 才能 
实现 。 关 于 postgresql.conf 文件 用 法 的 详情 请 参见 2.1.1 节 。 

支持 对 外 部 表 建 触发 器 。 通 过 该 功能 ， 即 便 外 部 数据 源 与 你 相隔 万 里 之 过 ， 只 要 对 方 一 
修改 数据 ， 你 立即 就 可 以 得 到 通知 。 不 过 目前 我 们 尚 不 确定 该 功能 的 实际 使 用 效果 到 底 
如 何 ， 因 为 在 数据 源 极 其 遥远 的 情况 下 ， 由 于 存在 网 络 延迟 ， 其 效果 就 很 难说 了 。 

新 增 unnest 函数 ， 该 函数 以 可 预见 的 方式 将 不 同 大 小 的 数组 分 配 到 各 个 列 中 。 

新 增 ROWS FROM 语法， 该 语法 可 以 将 多 个 国 数 返回 的 结果 集 逐 行 拼接 起 来 ， 最 后 作为 
一 个 完整 的 结果 集 返 回 ， 因 此 即使 这 些 结果 集 之 间 的 元 素 个 数 不 一 臻 也 没关系 ， 如 下 
例 所 示 : 















































SELECT * FROM RONS FROM ( 
jsonb_each('{"a":"foo1","b":"bar"}'::jsonb), 
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jsonb_each('{"c":"foo2"}'::jsonb)) x 
(al,al_val,a2_val); 


支持 使 用 C 对 动态 后 台 工 作 线程 进行 编码 以 按 需 完成 工作 。contrib/worker_spi 目录 下 的 
9.4 版 源码 中 实现 了 一 个 小 型 的 示例 可 供 参考 。 


1.4.3 PostgreSQL 9.3 版 新 特性 列表 
9.3 版 〈 发 布 于 2013 年 ) 中 引入 的 主要 特性 如 下 。 


增加 了 对 ANSI SQL 的 标准 LATERAL 子 句 的 支持 。LATERAL 语法 允许 将 FROM 子 句 与 关联 
一 起 使 用 以 引用 关联 的 另 一 方 上 的 变量 。 在 一 个 关联 查询 语句 中 ， 如 果 参 与 关联 的 一 方 
是 一 个 临时 结果 集 ， 比 如 一 个 子 查询 或 者 一 个 能 够 返回 结果 集 的 函数 ， 那 么 在 该 子 查询 
或 者 函数 中 可 以 引用 关联 关系 另 一 方 结果 集中 的 列 。 如 果 没 有 LATERAL 语法 ， 这 种 横向 
关联 是 不 可 能 的 ， 只 有 WHERE 关联 条 件 部 分 才能 进行 被 关联 方 之 间 列 的 交叉 引用 。 如 果 
你 需要 使 用 unnest、generate_series 或 者 以 正则 表达 式 作为 查询 条 件 的 查询 语句 来 构 
造 关 联 一 方 的 结果 集 ， 那 么 LATERAL 语法 几乎 是 不 可 或 缺 的 ， 因 为 这 种 情况 下 势必 要 参 
考 关联 关系 另 一 方 的 数据 才能 生成 自己 一 方 的 数据 。 请 参考 7.6 节 以 了 解 更 多 细节 。 
支持 并 行 pg_dump。 从 8.4 版 开始 支持 并 行 恢复 ， 在 该 版 本 中 实现 了 对 并 行 备份 的 支持 ， 
这 可 以 大 大 加 快 大 型 数据 库 的 备份 速度 。 

支持 物化 视图 (详细 信息 请 参见 7.1.3 节 )。 物 化 视图 可 以 将 经 常 使 用 的 视图 中 的 数据 进 
行 持久 化 ， 从 而 避免 反复 执行 相同 的 查询 。 

支持 自动 可 更 新 视图 。 对 视图 执行 更 新 操作 不 再 需要 创建 触发 器 或 者 规则 ， 现 在 可 以 直 
接 针 对 视图 执行 UPDATE 操作 ， 该 操作 在 系统 内 部 会 自动 映射 到 此 视图 的 基 表 上 。 
支持 定义 基于 递归 CTE 表达 式 的 视图 。 
支持 更 多 针对 JSON 类 型 的 构造 函数 和 解析 函数 。 详 见 7.6 节 。 

支持 在 基于 正则 表达 式 条 件 的 查询 中 使 用 索引 。 

引入 了 支持 64 位 大 对 象 操作 的 API， 该 API 可 操作 TB 级 大 小 的 对 象 。 之 前 最 多 支持 
到 2GB。 

postgres_fdw 驱动 程序 〈10.3.3 节 中 会 进行 介绍 ) 支持 对 其 他 PostgreSQL 数据 库 (即使 
在 使 用 较 低 版 本 PostgreSQL 的 远程 服务 器 上 ) 进行 读 写 操 作 。 伴 随 此 更 改 的 是 对 实施 
可 写 功能 的 FDW API 的 升级 。 

复制 功能 做 了 大 量 改 进 ， 其 中 最 主要 的 两 点 是 : 实现 了 复制 功能 的 架构 无 关 性 ， 即 复制 
的 架构 不 依赖 于 特定 的 操作 系统 或 者 硬件 ， 另 外 支持 了 基于 流 式 复制 的 重新 选 主 过 程 。 
支持 使 用 C 语言 创建 后 台 工 作 线程 ， 可 用 于 执行 一 些 定时 任务 。 

支持 对 DDL 操作 定义 触发 器 。 

支持 新 的 psql 命令 : watch。 详 细 信 息 参 见 3.4.2 节 。 

支持 新 的 COPY DATA 命令 ， 可 用 于 PostgreSQL 与 外 部 程序 之 间 导 入 或 者 导出 数据 。3.5.3 
节 有 详细 介绍 。 
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.4.4 ”PostgreSQL 9.2 版 新 特性 列表 
.2 版 (2012 年 9 月 发 布 ) 中 引入 的 主要 特性 如 下 。 


支持 索引 内 查询 。 如 果 查 询 的 列 都 位 于 索引 内 ， 那 么 PostgreSQL 会 省 略 不 必要 的 表 访 
问 动作 ， 仅 依据 索引 自身 数据 就 可 以 完成 全 部 查询 动作 。 该 优化 会 给 键 值 查询 以 及 类 似 
COUNT(*) 这 种 聚合 查询 带 来 巨大 的 性 能 提升 。 

内 存 排 序 操作 性 能 提升 可 达 20%。 

在 预 处 理 语 句 中 做 了 一 些 改进 。 现 在 会 对 预 处 理 语句 进行 解析 、 分 析 和 重 写 ,但 你 可 以 
跳 过 该 计划 来 避免 被 绑 定 到 特定 实 参 输 入 上 。 你 现在 还 可 以 保存 依赖 实 参 的 某 个 预 处 理 
语 名 的 计划 。 这 样 会 降低 预 处 理 语句 比 等 效 的 即席 查询 执行 得 更 差 的 几率 。 
支持 级 联 流 式 复制 ， 即 支持 从 一 个 slave 节点 到 另 一 个 slave 节点 的 流 式 复 制 。 

支持 基于 空间 分 区 树 算法 的 SP-GiST 索引 ， 这 种 索引 是 GiST 索引 的 强化 版 本 ， 对 于 很 
多 依赖 GiST 索引 的 扩展 包 来 说 ， 使 用 这 种 索引 可 以 得 到 巨大 的 性 能 提升 。 

新 增 了 对 ALTER TABLE IF EXISTS 语法 的 支持 ， 修 改 表 结构 之 前 可 以 不 用 再 检查 此 表 是 
否 存在 。 

ALTER TABLE 和 ALTER TYPE 这 两 个 命令 新 增 了 大 量 功 能 选项 ， 本 来 要 实现 这 些 功 能 的 话 
需要 删除 表 并 重建 。 更 多 细节 请 参见 depesz 博客 网 站 的 “More Alter Table Alter Types” 
这 篇 博文 (http://www.depesz.com/2012/02/14/waiting-for-9-2-more-rewrite-less-alter-table- 

































































alter-types/) 。 
增加 了 更 多 的 pg_dump 和 pg_restore 选项 。 细 节 请 参见 “9.2 版 中 pg_dump 工具 的 增强 ” 
(http://www.postgresonline.com/journal/archives/252-PostgreSQL-9.2-pg_dump-enhancem 





ents.html) 。 

新 增 了 对 PL/V8 语法 扩展 包 的 支持 ， 以 后 可 以 使 用 目前 非常 流行 的 JavaScript 语言 来 编 
写 函 数 。 

JSON 正式 成 为 系统 内 置 数 据 类 型 ,同时 转正 的 还 有 row_to_json 和 array_to_json 国 数 。 
使 用 Ajax 的 Web 开发 人 员 应 该 会 很 欢迎 该 特性 。 详 见 7.6 节 和 示例 7-16。 

新 增 了 对 区 间 数 据 类 型 的 支持 ， 不 再 需要 通过 编写 函数 来 实现 类 似 功 能 。 区 间 类 型 虽然 
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主 4; 语句 的 PREPARE 预 解析 机 制 有 改进 。 在 之 前 版 本 中 进行 PREPARE 操作 时 ， 规 划 器 会 对 预 解析 的 语 


























句 生 成 执行 计划 ， 但 由 于 此 时 的 语句 中 不 携带 具体 的 选项 值 ( 预 提交 的 语法 形式 如 PREPARE my_stmt 
AS select a from tab where b=$1 and c>$2)， 因 此 规划 器 会 基于 表 的 统计 信息 来 进行 推测 ， 并 生成 
一 个 通用 的 、 比 较 保 守 的 执行 计划 ， 这 往往 会 导致 得 到 的 执行 计划 并 非 最 优 ， 从 而 出 现 语句 经 过 预 
解析 后 再 执行 反而 比 直接 执行 更 慢 的 情况 。 为 解决 此 问题 ， 当 前 版 本 中 的 PREPARE 操作 有 所 变化 ， 
仍然 会 执行 语句 解析 、 语 句 分 析 、 语 句 改写 这 几 个 过 程 ， 但 会 跳 过 生成 执行 计划 这 一 步骤 ， 留 到 语 
句 EXECUTE 阶段 根据 真正 的 选项 再 生成 执行 计划 ， 这 样 就 保证 了 执行 计划 是 最 优 的 。 但 这 带 来 的 
另 一 个 问题 就 是 EXECUTE 效率 降低 ， 因 为 每 次 都 要 生成 执行 计划 。 为 此 系统 做 了 另 一 个 优化 : 如 
果 EXECUTE 阶段 生成 的 执行 计划 与 原来 在 PREPARE 阶段 生成 的 通用 执行 计划 效率 类 似 ， 那 么 系统 
还 是 会 将 通用 执行 计划 存储 下 来 并 复 用 。 通 过 以 上 策略 ， 避 免 了 有 时 执行 预 提交 的 语句 反而 更 慢 的 情 
况 。 一 一 译 者 注 
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是 首次 引入 ， 但 系统 为 其 提供 了 丰富 的 运算 符 和 配套 函数 。Exclusion 类 型 的 约束 可 以 
很 好 地 保证 该 类 型 数据 的 合法 性 。 

支持 在 SQL 函数 中 通过 实 参 名 称 引 用 实 参 ， 之 前 版 本 仪 支持 通过 实 参 编号 引用 实 参 。 
有 多 个 实 参 时 ， 通 过 实 参 名 称 引用 会 更 方便 。 











4.5 ”PostgreSQL 9.1 版 新 特性 列表 


在 9.1 版 中 ，PostgreSQL 推出 了 诸多 企业 级 特性 ， 开 始 与 SQL Server 和 Oracle 等 重量 级 对 
手 展 开 正面 竞争 。 


1 











内 置 的 复制 特性 全 面 增强 ， 支 持 同 步 复 制 。 

引入 新 的 CREATE EXTENSION 和 ALTER EXTENSION 命令 来 管理 扩展 包 ， 安 装 和 钊 载 扩 展 包 
变 得 轻而易举 。 

引入 兼容 ANSI 标 准 的 外 部 数据 封装 器 (FDW) 机 制 ， 用 于 查询 外 部 数据 源 。 

支持 可 写 CTE 表达 式 ， 此 后 UPDATE 和 INSERT 语句 也 可 以 享受 到 CTE 语法 带 来 的 便利 。 
支持 建立 无 日 志 的 表 ， 以 加 快 写 操作 速度 。 有 的 场景 下 ， 记 录 预 写 日 志 确 无 必要 。 

支持 针对 视图 建立 触发 器 。 在 之 前 的 版 本 中 ， 如 果 希 望 对 视图 进行 修改 操作 ， 只 能 通 
过 建立 D0 INSTEAD 类 型 的 规则 (详情 请 参见 官网 链接 : http://www.postgresql.org/docs/ 
current/interactive/rules-update.html) 来 实现 ， 且 这 种 规则 只 能 用 SQL 语言 编写 ,但 支持 
视图 触发 器 后 ， 就 可 以 用 上 PostgreSQL 支持 的 所 有 语言 ， 这 样 就 可 以 针对 视图 实现 更 
复杂 更 抽象 的 业务 逻辑 。 

引入 KNN GiST 索引 类 型 ， 该 类 索引 能 对 常用 的 很 多 扩展 包 带 来 性 能 提升 ， 比 如 全 文 检 
索 、 三 连词 〈 用 于 模糊 查找 以 及 区 分 大 小 写 查找 操作 ) 以 及 PostGIS 等 。 




































































.5 ”数据库 驱 动 程序 


任何 情况 下 ， 你 都 不 可 能 脱离 具体 的 业务 系统 而 仅仅 使 用 PostgreSQL 数据 库 本 身 ， 那 显然 
是 无 意义 的 。 为 了 实现 PostgreSQL 与 业务 系统 之 间 的 交互 ， 就 需要 借助 数据 库 驱 动 程序 。 
PostgreSQL 拥有 大 量 免费 驱动 ， 支 持 各 种 编程 语言 和 开发 工具 。 此 外 ， 很 多 商业 公司 也 以 


很 低廉 的 价格 提供 了 各 有 特色 的 驱动 。 目 前 比较 流行 的 几 种 开源 驱动 如 下 。 





























PHP 驱动 : PHP 语言 广泛 应 用 于 Web 开发 领域 ， 大 多 数 PHP 发 行 包 都 自 带 了 较 老 的 
pgsql 驱动 或 者 是 较 新 的 pdo_pgsql 驱动 。 一 般 来 说 这 两 种 驱动 默认 都 会 安装 ， 不 过 可 
能 需要 修改 php.ini 来 决定 启用 哪 一 种 。 

JDBC 驱动 : JAVA 开发 所 使 用 的 JDBC 驱动 一 直 是 与 最 新 版 PostgreSQL 同步 更 新 的 ， 
可 以 从 PostgreSQL 官方 站 点 下 载 (https:Wjdbc.postgresql.org ) 。 

.NET 驱动 :.NET 框 架 ( 含 微软 的 官方 版 和 Mono 社 区 的 开源 版 ) 可 使 用 Npgsql 驱动 (http:/ 
npgsql.projects.pgfoundry.org)。 目 前 该 驱动 支持 微软 .NET 框架 V3.5 及 之 后 的 版 本 ， 包 
括 微软 Entity Framework 开发 框架 以 及 Mono 开源 .NET 框架 。 
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。 ODBC 驱动 : 如 果 需 要 从 微软 Access、Office 系列 工具 或 者 其 他 支持 ODBC 的 产品 连 
接 到 PostgreSQL， 可 从 PostgreSQL 官网 下 载 ODBC 驱动 (http://www.postgresql.org/ftp/ 
odbc/versions/msi) ， 支 持 32 位 和 64 位 两 个 版 本 。 

。 LibreOffice/OpenOffice 驱动 :LibreOffice 3.5 及 之 后 的 版 本 中 自 带 了 PostgreSQL 驱动 ， 
但 3.5 之 前 的 版 本 以 及 OpenOffice 是 不 带 的 ， 可 以 使 用 JDBC 或 者 SDBC 驱动 。 更 多 细 
节 请 参见 “OO Base 与 PostgreSQL” 这 篇 博文 (http://www.postgresonline.com/journal/ 
categories/23-oobase) 3 

。 Python 驱动 : Python 可 通过 多 种 驱动 (https://wiki.postgresql.org/wiki/Python) 访问 Post 
greSQL， 目 前 psycopg 《http://initd.org/psycopg/) 是 最 流行 的 一 种 。Python 的 Django 开发 
框架 (https://docs.djangoproject.com/en/dev/ref/databases/#postgresql-notes) 对 PostgreSQL 也 
有 着 良好 的 支持 。 

。 Ruby 驱动 : 对 Ruby 开发 人 员 来 说 ， 请 使 用 rubygems pg 驱动 (https://rubygems.org/ 
gems/pg)。 

。 Perl 驱动 : Perl 可 以 使 用 DBI 和 DBD::Pg 驱动 。 也 可 以 使 用 由 CPAN 网 站 (http:/ 
search.cpan.org/modlist/Database_Interfaces) 提供 的 DBD::PgPP 驱动 。 

。 Node.js 驱动 : Node.js 是 一 个 基于 Google V8 JavaScript 引擎 的 运行 平台 ， 可 用 于 构建 
高 可 扩展 性 的 网 络 应 用 。 该 平台 目前 支持 三 种 PostgreSQL 驱动 : Node Postgres (https:// 
github.com/brianc/node-postgres)、Node Postgres Pure ( 与 前 者 的 区 别 在 于 不 需要 编 
译 ，https://github.com/brianc/node-postgres-pure)， 以 及 Node-DBI (https://github.com/ 
DrBenton/Node-DBI) 。 


1.6 如何 获得 帮助 


在 使 用 PostgreSQL 过 程 中 ， 你 迟早 会 需要 寻求 帮助 ， 我 们 希望 你 能 够 尽早 了 解 到 求助 的 途 
径 。 我 们 最 为 推荐 的 途径 是 邮件 列表 ， 不 管 你 是 PostgreSQL 的 新 用 户 还 是 老 用 户 ， 邮 件 列 
表 都 能 为 你 解答 技术 问题 。 可 以 先 打 开 PostgreSQL 邮件 列表 页 面 (http://www.postgresql. 
org/community/lists/) ， 该 页 面 上 有 各 种 邮件 列表 的 信息 以 及 订阅 方法 。 如 果 你 是 新 手 ， 那 
么 订阅 PGSQL-General 这 个 邮件 列表 〈 该 邮件 列表 的 历史 信息 归档 地 址 : http://archives. 
postgresql.org/pgsql-general) 是 最 合适 的 。 如 果 你 发 现 了 PostgreSQL 的 bug， 那 么 打开 
“PostgreSQL 故障 报告 ”这 个 页 面 (http://www.postgresql.org/docs/current/interactive/bug- 
reporting.html) ， 上 面 会 告诉 你 具体 如 何 操作 。 


1.7 PostgreSQL 的 主要 衍生 版 本 

PostgreSQL 使 用 了 MIT/BSD 风格 的 许可 证 ， 任 何人 都 可 以 合法 地 对 其 修改 并 二 次 传播 ， 
因此 对 于 那些 想 创建 自己 数据 库 分 支 的 人 来 说 ，PostgreSQL 是 绝 佳 的 选择 。 在 过 去 的 很 
多 年 间 ， 有 很 多 团队 创建 了 自己 的 PostgreSQL 衍生 版 本 ， 甚 中 的 部 分 修改 也 已 经 回馈 到 
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PostgreSQL 的 主干 代码 中 。 


目前 数据 仓库 领域 使 用 很 广泛 的 Netezza (http://www.netezza.com) 就 是 源 自 PostgreSQL。 
亚马逊 公司 的 Redshift 数据 仓库 (http://aws.amazon.com/redshift/) 事实 上 是 PostgreSQL 的 
一 个 分 支 的 分 支 。 支 持 PB 级 数据 分 析 的 著名 数据 仓库 GreenPlum 最 初 的 源头 是 Bizgres， 
而 Bizgres 是 一 款 基 于 PostgreSQL 的 面向 大 数据 的 数据 仓库 和 智能 分 析 软 件 。EnterpriseDB 
公司 (http:/enterprisedb.com) 推出 的 PostgreSQL Advanced Plus 也 是 以 PostgreSQL 为 基 
础 ， 另 外 增加 了 对 于 Oracle 语法 和 特性 的 兼容 支持 ， 以 吸引 原 Oracle 用 户 。EnterpriseDB 
公司 向 PostgreSQL 社区 提供 了 资金 和 开发 力量 的 支持 ， 对 此 我 们 表示 感谢 。 他 们 的 
Postgres Plus Advanced Server 产品 在 版 本 更 新 节奏 上 也 一 直 是 密切 跟 进 最 新 的 PostgreSQL 
稳定 版 的 。 






































前 述 衍生 产品 都 是 商业 化 的 财源 软件 。tPostgres (http://www.tpostgres.org)、Postgres-XC 
(http://postgres-xc.sourceforge.net) 和 Big SQL (http://www.bigsql.org) 是 三 款 还 处 于 发 展 
初期 但 已 经 办 露头 角 的 开源 衍生 产品 ， 它 们 都 得 到 了 OpenSCG 公司 〈http:/www.openscg. 
com/) 的 资金 支持 。tPostgreSQL 的 最 新 版 本 基于 PostgreSQL 9.3， 甚 目标 是 取代 Microsoft 
SQL Server。tPostgreSQL 中 内 内 了 pgtsql 语言 扩展 包 ， 可 以 用 TSQL 语法 来 编写 国 数 。 
pgtsql 语言 包 是 标准 的 PostgreSQL 扩展 包 ， 因 此 它 其 实 可 以 安装 到 任何 一 台 PostgreSQL 
9.3 数据 库 上 。Postgres-XC 是 一 套 集群 服务 器 系统 ， 它 能 够 提供 可 扩展 的 写 能 力 并 支持 
同步 多 主 复制 ， 其 分 布 式 处 理 和 多 主 复制 能 力 使 它 在 所 有 类 似 系统 中 脱颖而出 。 目 前 
Postgres-XC 还 只 是 1.0 版本。 最 后 介绍 一 下 BigSQL， 它 实现 了 PostgreSQL 和 Hadoop 
with Hive 这 两 款 重量 级 产品 的 融合 。BigSQL 自 带 了 hadoop_fdw 这 款 扩展 包 ， 可 以 查询 和 
更 新 外 部 Hadoop 数据 源 的 数据 。 









































此 外 ， 最 近 还 发 布 了 一 款 PostgreSQL 开源 分 支 产 品 Postgres-XL (XL 代表 eXtensible 
Lattice， 即 可 扩展 的 唱 格 。http:/www.postgres-xlorg/) ， 该 产品 面向 大 规模 并 行 处 理 
(MPP) 领域 ， 支 持 节 点 间 数 据 的 分 片 存 储 能 
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本 章 涵盖 了 管理 PostgreSQL 最 常用 的 一 些 基 本 操作 ,包括 角色 与 权限 管理 、 数 据 库 的 创 
建 、 插 件 安装 、 数 据 备份 与 恢复 等 。 我 们 假定 你 已 经 安装 好 了 一 套 PostgreSQL 及 其 相应 的 
管理 工具 ， 并 且 你 有 权 任 意 地 调整 和 使 用 该 套 环 境 ， 切 记 勿 在 生产 环境 上 执行 测试 动作 。 


2.1 配置 文件 


配置 文件 控制 着 一 个 PostgreSQL 服务 器 实例 的 基本 行为 ， 主 要 包含 以 下 几 个 文件 。 















































。 postgresql.conf 
该 文件 包含 一 些 通用 设置 ， 比 如 内 存 分 配 、 新 建 database 的 默认 存储 位 置 、PostgreSQL 
服务 右 的 卫 地 址 、 日 志 的 位 置 以 及 许多 其 他 设置 。9.4 版 中 引入 了 一 个 新 的 postgresql. 
auto.conf 文件 ， 任 何 时 候 执行 ALTER SYSTEM SQL 命令 ， 都 会 创建 或 重 写 该 文件 。 该 文 
件 中 的 设置 会 替代 postgresql.conf 文件 中 的 设置 。 








。 pg_hba.conf 
该 文件 用 于 控制 访问 安全 性 ， 管 理 客户 端 对 PostgreSQL 服务 器 的 访问 权限 ， 内 容 包 括 : 
允许 哪些 用 户 连 接 到 哪个 数据 库 ， 人 允许 哪些 下 或 者 哪个 网 段 的 耳 连接 到 本 服务 器 ， 以 
及 指定 连接 时 使 用 的 身份 验证 模式 。 


。 pg_ident.conf 
pg_hba.conf 的 权限 控制 信息 中 的 身份 验证 模式 字段 如 果 指 定 为 ident 方式 ， 则 用 户 连 
接 时 系统 会 尝试 访问 pg_ident 文件 ， 如 果 该 文件 存在 ， 则 系统 会 基于 文件 内 容 将 当前 


执行 登录 操作 的 操作 系统 用 户 映 射 为 一 个 PostgreSQL 数据 库 内 部 用 户 的 身份 来 登录 。 
有 些 人 会 把 操作 系统 的 root 用 户 映射 为 PostgreSQL 的 postgres 超级 用 户 账号 。pg_ 
hba.conf 中 的 每 条 权限 控制 信息 均 可 以 指定 一 个 独立 的 pg_ident.conf 文件 作为 用 户 映 
射 信 息 数 据 源 。 


如 果 你 在 安装 过 程 中 使 用 了 默认 配置 ， 则 上 述 文件 会 位 于 PostgreSQL 主 数据 文件 夹 中 。 
你 可 以 使 用 任何 文本 编辑 器 来 编辑 这 些 文 件 ， 或 者 在 pgAdmin 工具 中 专门 的 功能 页 面 上 
也 可 以 进行 修改 (在 pgAdmin 工具 中 直接 修改 系统 配置 文件 的 功能 是 基于 PostgreSQL 提 
供 的 Admin Pack 系列 管理 API 实现 的 ) 。4.2.2 节 中 会 有 关于 如 何在 pgAdmin 工具 中 修改 
postgresql.conf 和 pg_hba.conf 文件 的 介绍 。 如 果 你 不 确定 这 些 文件 的 具体 位 置 ， 请 以 超级 
用 户 身份 连接 到 任何 一 个 数据 库 上 并 执行 示例 2-1 中 的 查询 语句 即 可 找到 。 












































示例 2-1: 配置 文件 的 位 置 
SELECT name, setting FROM pg_settings WHERE category = 'File Locations'; 


name | setting 
ee et eh da te ed 
config file | /etc/postgresql/9.3/main/postgresql.conf 
data_directory | /var/lib/postgresql/9.3/main 
external_pid file | /var/run/postgresql/9.3-main.pid 
hba_file | /etc/postgresql/9.3/main/pg_hba.conf 
ident_ file | /etc/postgresql/9.3/main/pg_ident.conf 


2.1.1 postgresql.conf 

postgresql.conf 文件 包含 了 PostgreSQL 服务 能 够 正常 运行 所 必需 的 基础 设置 以 及 新 建 数 据 
库 时 所 使 用 的 默认 设置 。 你 可 以 在 数据 库 级 、 用 户 级 、 会 话 级 甚至 是 国 数 级 坎 代 这 些 设 
置 。“ 对 你 的 PostgreSQL 服务 器 进行 调 优 ”(https://wiki.postgresql.org/wiki/Tuning_Your_ 
PostgreSQL_Server) 这 篇 文章 详细 介绍 了 如 何 通 过 修改 设置 来 对 你 的 PostgreSQL 系统 进行 
优化 。 

通过 查询 pg_settings 视图 可 以 很 方便 地 检查 当前 设置 ， 示例 2-2 展示 了 具体 语法 。 该 示 
例 中 查询 了 主要 的 儿 个 关键 设置 并 给 出 了 查询 结果 中 每 一 列 的 含义 说 明 ， 但 如 果 你 希望 更 
深入 地 了 解 这 些 设 置 ， 我 们 建议 你 参考 官方 手册 中 的 相关 介绍 (http://www.postgresql.org/ 


docs/currenUinteractive/view-pg-settings.html) 。 
































示例 2-2: 关键 的 设置 
SELECT name, context ©@, unit @, 
setting, boot val, reset val © 
FROM pg_settings 
WHERE name IN ( 'listen addresses', 'max_connections', 'shared_ buffers', 'effec 
tive_cache_size', 'work_ mem', 'maintenance work_mem' 


) 


ORDER BY context, name; 
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name | context | unit | setting | boot val | reset val 
---------------------- +------------+------+---------+-----------+----------- 
Listen_addresses | postmaster | | * | LocaLhost | * 
max_connections | postmaster | | 100 | 100 | 100 
shared_buffers | postmaster | 8kB | 131584 | 1024 | 131584 
effective_cache_size | user | 8kB | 16384 | 16384 | 16384 
maintenance_work_mem | user | kB | 16384 | 16384 | 16384 
work_mem | user | kB | 5120 | 1024 | 5120 


@ 如 果 将 context 设置 为 postmaster， 那 么 更 改 此 形 参 后 需要 重启 PostgreSQL 服务 才能 














生效 ， 如 果 将 其 设置 为 user， 那 么 只 需要 执行 一 次 重新 加 载 即 可 全 局 生效 。 重 启 数据 
库 服 务 会 终止 活动 连接 ， 但 重新 加 载 不 会 。 

unit 字段 表示 这 些 设置 的 单位 。 示 例 2-2 的 输出 结果 中 内 存 设 置 的 单位 可 能 会 让 你 觉 
得 有 点 乱 ， 有 些 是 以 8 KB 为 单位 ， 有 些 是 以 KB 为 单位 。 在 postgresql.conf 中 设置 内 
存 时 ， 请 尽量 选择 一 个 合适 的 数值 单位 ,比如 我 们 要 将 内 存 设 定 为 128 MB ， 那 么 “xxx 
= 128 MB” 就 是 一 个 比较 好 的 写法 ， 而 “xxx = 131072 KB” 显 然 就 不 太 好 ， 虽 然 二 
者 是 等 价 的 。 你 也 可 以 通过 SHOW 命令 查看 特定 系统 设置 ， 比 如 : SHOW effective_ 
cache_size 或 SHOW maintenance_work_mem。SHOW 命令 的 输出 结果 会 自动 根据 数值 大 
小 选择 合适 的 单位 。 如 果 和 希望 一 次 性 查看 使 用 了 合适 单位 的 所 有 设置 ， 可 以 使 用 SHON 
ALL 命令 ， 其 输出 结果 会 针对 每 个 设置 选用 合适 的 单位 。 

setting 是 指 当前 设置 ，boot_val 是 指 默认 设置 ，reset_val 是 指 重新 启动 服务 器 或 重 
新 加 载 设置 之 后 的 新 设置 。 在 postgresql.conf 中 修改 了 设置 后 ， 一 定 要 记得 查看 一 下 
setting 和 reset_val 并 确保 二 者 是 一 致 的 ， 否 则 说 明 设置 并 未 生效 ， 需 要 重新 启动 服 
务 器 或 者 重新 加 载 设置 。 















































请 特别 注意 postgresql.conf 中 的 以 下 网 络 设置 ， 修 改 这 些 值 是 一 定 要 重新 启动 数据 库 服 
务 的 。 





对 于 9.4 版 及 之 后 的 版 本 来 说 ，postgresqlauto.conf 的 优先 级 是 高 于 
postgresql.conf 的 ， 如 果 这 两 个 文件 中 存在 同名 配置 项 ， 则 系统 会 优先 使 用 
前 者 设 定 的 值 。 





Listen_addresses 
表示 PostgreSQL 服务 使 用 的 IP 地 址 ， 一 般 会 设 定 为 locathost 或 者 LocaL， 但 也 有 很 
多 人 会 设 为 *， 表 示 使 用 本 机 任 一 IP 地 址 均 可 连接 到 PostgreSQL 服务 。 


port 
PostgreSQL 服务 的 侦 听 端口 ， 默 认 值 为 5432。 如 果 是 在 Red Hat 或 者 CentOS 平台 上 ， 
可 以 更 改 PGPORT 值 /etc/sysconfig/pgsql/your_service_name_here 来 更 改 侦 听 端口 。 
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按 
通 


下 


max_connections 


系统 允许 的 最 大 并 发 连接 数 。 


照 我 们 的 经 验 ， 以 下 四 个 设置 对 系统 性 能 有 着 全 局 性 的 影响 ， 我 们 建议 你 在 实际 环境 下 
过 实测 来 找到 最 优 值 。 





shared_buffers 

此 设置 定义 了 用 于 缓存 最 近 访 问 过 的 数据 页 的 内 存 区 大 小 ， 所 有 用 户 会 话 均 可 共享 此 缓 
存 区 。 此 设置 对 查询 速度 有 着 重大 影响 ， 一 般 来 说 是 越 大 越 好 ， 至 少 应 该 达到 系统 总 
存 的 25%， 但 不 宜 超过 8 GB， 因 为 超过 后 会 出 现 “ 边 际 收益 递减 ”效应 ， 即 消耗 的 内 
存 很 多 ,但 得 到 的 速度 提升 却 很 少 ， 得 不 偿 失 。 修 改 此 设置 需要 重启 PostgreSQL 服务 。 





effective _ cache_size 

此 设置 表示 一 个 查询 执行 过 程 中 可 以 使 用 的 最 大 缓存 ， 包 括 操作 系统 使 用 的 部 分 以 及 
PostgreSQL 使 用 的 部 分 。 系 统 并 不 会 根据 这 个 值 来 真实 地 分 配 这 么 多 内 存 ， 但 是 规划 
器 会 根据 这 个 值 来 判断 系统 能 否 提 供 查询 执行 过 程 中 所 需 的 内 存 。 如 果 将 此 设置 设 得 过 
小 ， 远 远 小 于 系统 真实 可 用 内 存量 ， 那 么 可 能 会 给 规划 器 造成 误导 ， 让 规划 器 认为 系统 
可 用 内 存 有 限 ， 从 而 选择 不 使 用 索引 而 是 走 全 表 扫 描 (因为 使 用 索引 虽然 速度 快 ， 但 需 
要 占用 更 多 的 中 间 内 存 )。 在 一 台 专 用 于 运行 PostgreSQL 数据 库 服务 的 服务 器 上 ， 建 议 
将 effective_cache_size 的 值 设 为 系统 总 内 存 的 一 半 或 者 更 多 。 此 设置 的 更 改 可 动态 生 
效 ， 执 行 重新 加 载 即 可 。 


























work_mem 

此 设置 指定 了 用 于 执行 排序 、 哈 希 关联 、 表 扫描 等 操作 的 最 大 内 存量 。 要 得 到 此 设置 的 
最 优 值 需要 考虑 以 下 一 些 因 素 : 数据 库 的 使 用 方式 ， 需 要 预 留 多 少 内 存 给 除数 据 库 系 
统 外 的 程序 ， 以 及 服务 器 是 否 专 用 于 运行 PostgreSQL 服务 等 问题 。 如 果 使 用 场景 仅仅 
是 有 很 多 用 户 并 发 执行 简单 查询 ， 那 么 这 个 值 设 得 很 小 也 没 问 题 。 关 于 work_men 设置 
有 一 篇 很 好 的 文章 “理解 work_mem” (http://www.depesz.com/2011/07/03/understanding- 
postgresql-conf-work_mem/)。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 



































maintenance_work_mem 

此 设置 指定 可 用 于 vaccum 操作 ( 即 清空 已 标记 为 “被 删除 ”状态 的 记录 ) 这 类 系统 内 
部 维护 操作 的 内 存 总 量 。 其 值 不 应 大 于 1 GB。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 
载 即 可 。 





























述 设置 可 在 库 级 、 用 户 级 以 及 国 数 级 设置 。 例 如 ， 如 果 有 一 个 精通 SQL 的 用 户 要 在 库 上 





执行 非常 复杂 的 SQL 语句 ， 那 么 可 以 为 此 用 户 单独 调 大 work_men 的 值 。 又 比如 有 一 个 国 


数 


中 有 很 多 排序 操作 ， 那 么 可 以 仅 针对 此 函数 调 大 work_men 的 值 。 


PostgreSQL 9.4 版 中 引入 了 对 新 的 ALTER SYSTEM SQL 命令 的 支持 ， 使 用 该 命令 可 以 更 改 设 
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置 。 例 如 ， 如 果 要 全 局 设置 work_mem， 执 行 以 下 命令 即 可 : 
ALTER SYSTEM set work_mem = 8192; 


每 个 设置 有 着 各 自 不 同 的 特性 ， 有 的 更 改 后 必须 重启 数据 库 服务 才能 生效 ， 有 的 只 要 重新 
加 载 一 次 就 可 以 了 ， 下 面 这 个 命令 可 以 实现 设置 重新 加 载 : 











SELECT pg_reload_conf(); 








PostgreSQL 记录 更 改 是 在 一 个 称 为 postgresql.auto.conf 的 替代 文件 中 通过 ALTER SYSTEM 所 
做 出 的 ， 而 不 是 直接 对 postgresql.conf 进行 更 改 。 


“ 遇 到 修改 了 postgredql.conf 文 件 ， 结 果 服 务 器 崩 演 了 这 种 情况 。 
定位 这 种 问题 最 简单 的 方法 是 查看 日 志文 件 ， 该 文件 位 于 PostgreSQL 数据 文件 夹 的 根 目 录 
或 者 pg_log 子 文件 夹 下 。 只 要 找到 最 近 修 改 的 那个 日 志文 件 并 查看 其 最 后 部 分 的 内 容 就 能 
找到 本 次 问题 的 相关 错误 日 志 ， 日 志 的 内 容 一 般 都 是 比较 直 白 易 懂 的 ， 你 看 了 就 会 明白 。 
最 常见 的 错误 是 把 shared_buffers 设 得 太 大 了 ， 还 有 一 个 常见 问题 是 由 于 上 次 系统 异常 关 
闭 导致 遗留 了 一 个 没 来 得 及 删除 的 postmaster.pid 文件 ， 该 文件 就 位 于 数据 文件 夹 下 ， 你 可 
以 手动 删除 该 文件 并 重新 启动 PostgreSQL。 














2.1.2 pg_hba.conf 


pg_hba.conf 文件 指定 了 允许 哪些 用 户 以 何 种 方式 连接 到 PostgreSQL 数据 库 。 针 对 该 文件 
的 修改 可 动态 生效 。 一 个 典型 的 pg_hba.conf 文件 看 起 来 如 示例 2-3 所 示 。 














示例 2-3: pg_hba.conf 文件 示例 


# TYPE DATABASE USER ADDRESS METHOD 

# IPv4 local connections : 

host all all 127.0.0.1/32 ident @ 

# IPV6 local connections: 

host all all ::1/128 @trust 

host all all 192.168.54.0/24 @md5 

hostssl @ all all 0.0.0.0/0 md5 

# Allow replication connections from localhost, by a user with the © 
# replication privilege. 

#host replication postgres 127.0.0.1/32 trust 
#host replication postgres ::1/128 trust 





@ 身份 验证 模式 。 一 般 有 以 下 几 种 常用 选项 : ident、trust、nmd5 以 及 password。 从 
9.1 版 开始 引入 了 peer 身份 验证 模式 (详情 请 参考 官方 手册 相关 章 市 : http:/www. 
postgresql.org/docs/current/interactive/auth-methods.html)。ident 和 peer 模式 仅 适 用 于 
Linux、Unix 和 Mac， 不 适用 于 Windows。 一 些 比较 少见 的 身份 验证 模式 ， 比 如 gss、 
radtus、Ldap 以 及 pam 等 ， 可 能 并 不 会 在 所 有 的 发 行 版 中 都 默认 安装 。 
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@ 用 于 定义 网 络 范 围 的 IPv6 语法 。 只 有 服务 器 支持 IPv6 时 才 可 以 配置 该 项 ， 如 果 在 非 
IPv6 网 络 环境 下 配置 了 这 样 的 条 目 ， 系 统 会 直接 忽略 该 配置 项 。 

@ 用 于 定义 网 络 范 围 的 IPv4 语法 。 第 一 部 分 〈 本 例 中 为 192.168.54.0) 是 网 络 地 址 ， 
后 面 跟着 的 /24 是 位 掩 码 。 本 例 中 这 样 定义 可 以 达到 如 下 效果 : 对 于 任何 一 个 位 于 
192.168.54.0 子 网 中 的 客户 端 来 说 ， 只 要 该 客户 端 提供 的 经 mq5 算法 加 密 的 密码 是 正确 
的 ， 那 么 系统 就 允许 该 客户 端 连 到 数据 库 服务 器 。 

@ 这 是 针对 SSL 连接 的 规则 。 本 例 中 ， 任 何 使 用 SSL 连接 并 能 提供 合法 md5 加 密 密 码 的 
客户 端 都 可 以 连接 到 本 地 数据 库 服务 器 。 

@ 此 处 是 一 套 复制 系统 中 其 他 成 员 节点 的 卫 地 址 列表 ， 每 个 成 员 的 地 址 都 必须 存在 于 此 
列表 中 ， 否 则 无 法 加 入 该 复制 系统 。 该 特性 从 9.0 版 开始 引入 。 本 例 中 ， 这 几 行 是 注释 
掉 的 。 



































对 于 每 一 个 连接 请 求 ，postgres 服务 会 按照 pg_hba.conf 文件 中 记录 的 规则 条 目 自 上 而 下 
进行 检查 。 当 匹配 到 第 一 条 允许 此 请 求 接 入 的 规则 时 ， 就 不 再 往 下 检查 ， 系 统 将 允许 该 连 
接 请 求 。 类 似 地 ， 如 果 匹 配 到 一 条 拒绝 此 连接 请 求 的 规则 ， 也 不 再 继续 检查 ， 并 拒绝 该 连 
接 请 求 。 如 有 果 一 直 搜 索 到 文件 的 末尾 都 没 能 找到 匹配 项 ， 那 么 按照 默认 规则 处 理 ， 即 拒绝 
该 连接 。 大 家 人 常 犯 的 一 个 错误 是 把 规则 的 顺序 放 错 。 例 如 ， 如 果 你 将 +86.0.0.9/6 reject+ 
规则 放 到 +127.0.9.1/32 trust+ 的 前 面 ， 那 么 此 时 本 地 用 户 全 都 无 法 连接 ， 即 使 下 面 有 规 
则 允许 也 不 行 。 















































1. “ 遇 到 修改 了 ph_hba.conf 文 件 ， 结 果 服 务 器 崩溃 了 这 种 情况 。” 

不 用 担心 ， 这 种 事情 经 常 发 生 ， 解 决 起 来 不 难 。 这 一 般 是 因为 拼写 错误 或 增加 了 一 种 不 支 
持 的 身份 验证 模式 导致 。 如 果 postgres 服务 无 法 正确 地 解析 pg_hba.conf 文件 ， 那 么 为 确 
保 系统 安全 它 会 禁止 所 有 的 连接 请 求 甚至 是 禁止 系统 启动 。 最 简单 的 诊断 方法 是 看 一 下 日 
志 ， 文 件 就 在 数据 文件 夹 的 根 目录 下 或 者 其 pg_log 子 文件 夹 下 。 可 以 打开 修改 日 期 最 近 的 
日 志文 件 并 看 一 下 最 后 部 分 的 内 容 ， 错 误 提示 信息 一 般 就 在 那里 ， 而 且 一 般 都 是 很 好 理解 
的 。 如 果 你 经 常会 笔 误 改 错 东西 ， 那 么 请 一 定 记 得 在 修改 配置 文件 之 前 做 个 备份 。 


2. 身份 验证 方法 

PostgreSQL 提供 了 多 种 模式 用 于 用 户 身份 验证 ， 很 可 能 是 所 有 数据 库 里 面 支持 的 模式 最 多 
的 。 大 多 数 人 只 会 用 到 其 中 几 种 最 常见 的 : trust、peer、ident、nmd5 和 password。 还 有 一 
种 reject 模式 ， 其 作用 是 拒绝 所 有 请 求 。pg_hba.conf 中 定义 的 这 些 身份 验证 规则 就 好 像 
是 整个 PostgreSQL 服务 器 的 看 门人 ， 确 保 着 整个 系统 的 外 部 访问 安全 。 当 然 ， 在 通过 了 这 
一 层 外 部 安全 控制 并 成 功 建立 连接 以 后 ， 连 上 来 的 用 户 仍 需 遵 守 角 色 权 限 和 数据 库 访问 限 
制 等 内 部 约束 规则 。 


如 需 了 解 有 关 各 种 身份 验证 方法 的 详细 内 容 ， 请 参考 官方 手册 中 的 “PostgreSQL 客户 端 身 


份 验证 ”(http://www.postgresql.org/docs/current/interactive/client-authentication.html)。 最 常 
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用 的 身份 验证 方法 有 以 下 这 些 。 

。 trust 
这 是 最 不 安全 的 身份 验证 模式 。 该 模式 允许 用 户 “ 自 证 清白 "， 即 可 以 不 用 密码 就 连接 
到 数据 库 。 只 要 源 端 卫 地 址 、 连 接 用 户 名 、 要 访问 的 database 名 都 与 该 条 规则 匹配 ， 
用 户 就 可 以 连 上 来 。trust 模式 很 不 安全 ， 因 此 应 对 其 使 用 予以 限制 ， 即 只 能 允许 从 数 
据 库 服务 器 本 机 发 起 的 连接 或 者 是 同属 内 网 的 用 户 发 起 的 连接 使 用 此 模式 。 但 即使 加 了 
前 述 限 制 也 不 能 保证 安全 ， 因 为 会 有 人 通过 伪装 全 地址 的 方式 来 冒 用 此 权限 ， 所 以 有 
人 认为 该 模式 应 该 被 彻底 禁用 。 然 而 在 单 用 户 的 桌面 环境 下 这 却 是 最 常用 的 身份 验证 模 
式 ， 因 为 一 般 这 种 场景 下 系统 的 安全 性 根本 不 是 问题 。 连 接 时 如 果 未 指定 用 户 名 ， 那 么 
默认 会 使 用 当前 登录 的 操作 系统 用 户 名 。 



































。 md5 
该 模式 很 常用 ， 要 求 连 接 发 起 者 携带 用 md5 算法 加 密 的 密码 。 





。 password 

不 推荐 ， 因 为 该 模式 使 用 明文 密码 进行 身份 验证 ， 不 安全 。 
。 ident 

该 身份 验证 模式 下 ， 系 统 会 将 请 求 发 起 者 的 操作 系统 用 户 映 射 为 PostgreSQL 数据 库 内 
部 用 户 ， 并 以 该 内 部 用 户 的 权限 登录 ， 且 此 时 无 需 提 供 登 录 密 码 。 操 作 系 统 用 户 与 数据 
库 内 部 用 户 之 间 的 映射 关系 会 记录 在 pg_ident.conf 文件 中 。 











。 peer 
该 模式 使 用 连接 发 起 端的 操作 系统 名 进行 身份 验证 。 仅 可 用 于 Linux、BSD、Mac OS X 
和 Solaris， 并 且 仅 可 用 于 本 地 服务 器 发 起 的 连接 。 


多 种 身份 验证 模式 是 可 以 同时 使 用 的 ， 即 使 是 针对 同一 个 datapase 也 可 以 这 么 做 ， 也 就 是 
说 我 们 可 以 针对 同一 个 database 设置 多 条 身份 验证 规则 ， 并 且 每 条 规则 的 身份 验证 模式 都 
不 一 样 。 虽 然 身份 验证 模式 很 灵活 ， 但 请 你 务必 牢记 PostgreSQL 对 于 pg_hba.conf 中 的 规 
则 的 查找 顺序 是 从 上 到 下 ， 第 一 条 匹配 到 的 规则 就 是 系统 使 用 的 规则 。 








2.1.3 配置 文件 的 重新 加 载 

很 多 (但 非 全 部 ) 配置 文件 更 改 后 必须 要 重启 postgres 服务 才能 生效 ， 但 另外 一 些 只 需要 
执行 一 次 重新 加 载 即 可 生效 。 重 新 加 载 的 过 程 并 不 会 中 断 当 前 已 建立 的 连接 。 打 开 一 个 命 
令 行 窗 口 执行 以 下 命令 即 可 。 





busd 














pg_ctl reload -D your_data directory here 


如 果 你 在 RedHat Enterprise Linux、CentOS 或 者 Ubuntu 上 是 以 服务 的 形式 安装 的 
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PostgreSQL， 那 么 请 执行 以 下 命令 。 
service postgresql-9.3 reload 


上 述 命令 中 的 postgresqL-9.3 是 服务 名 。 对 于 较 老 的 版 本 来 说 ， 服 务 名 可 能 就 叫 
postgresql， 不 带 版 本 号 。 


另 一 种 重新 加 载 配置 文件 的 方法 是 以 超级 用 户 权 限 登录 到 任何 一 个 database 并 执行 以 下 
SQL 语句 : 








SELECT pg_reload_conf(); 


另外 也 可 以 从 pgAdmin 工具 中 执行 重新 加 载 ， 请 参考 4.2.2 市 。 


2.2 连接 管理 


我 们 可 能 时 不 时 地 会 遇 到 一 些 想 要 终止 数据 库 连 接 的 情况 ， 比 如 有 人 执行 了 写 得 很 精 糕 的 
SQL 语句 把 系统 资源 耗 光 ， 当 然 这 肯定 不 是 他 的 本 意 ， 又 比如 你 在 执行 某 些 语句 时 发 现 其 
耗 时 太 长 ， 超 出 了 自己 忍耐 的 极限 。 发 生 这 些 情况 时 ， 我 们 一 般 都 会 希望 结束 这 些 操作 或 
者 干脆 彻底 终止 这 个 连接 。 另 外 ， 当 我 们 执行 全 库 备 份 、 全 库 恢复 或 者 对 有 人 正在 访问 的 
表 执行 数据 恢复 时 ， 我 们 都 会 需要 先 终止 一 些 相 关连 接 。 下 面 将 介绍 具体 的 操作 过 程 。 


请 记 住 ， 强 行 终止 连接 是 一 种 很 不 “优雅 ”的 行为 ， 应 当 尽 量 少 用 。 应 当先 在 客户 端 应 用 
程序 中 通过 某 种 方式 判定 并 记录 下 那些 已 经 失控 〈 耗 时 长 或 者 占 资 源 多 ) 的 语句 ， 然 后 基 
于 这 些 记录 下 来 的 信息 分 析出 应 该 终止 哪些 相关 连接 。 出 于 礼貌 ， 你 应 该 在 终止 连接 之 前 
通知 相关 用 户 其 连接 即将 被 强行 终止 ， 或 者 如 果实 在 有 必要 ， 你 也 可 以 不 管 它 什 么 礼貌 不 
礼 狐 ， 等 四 下 无 人 时 直接 终止 这 些 连 接 就 好 了 。 


我 们 一 般 会 使 用 以 下 三 个 SQL 语句 来 取消 正在 运行 的 查询 并 终止 连接 。 以 下 是 典型 的 


流程 。 


(1) 查 出 活动 连接 列表 及 其 进程 ID。 









































SELECT * FROM pg_stat_activity; 








该 命令 还 能 查 出 每 个 连接 上 最 近 一 次 执行 的 语句 、 使 用 的 用 户 名 (usename 字段 )、 所 
在 的 database 名 (datname 字段 ) 以 及 语句 开始 执行 的 时 间 。 通 过 查询 该 视图 可 以 找到 
需要 终止 的 会 话 所 对 应 的 进程 ID。 


(2) 取消 连接 上 的 活动 查询 。 








SELECT pg_cancel_backend(procid); 


该 操作 不 会 终止 连接 本 身 。 
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(3) 终止 该 连接 。 
SELECT pg_terminate_backend(procid); 
如 果 你 未 停止 某 个 连接 上 正在 执行 的 语句 就 直接 终止 该 连接 ， 那 么 这 些 语 句 此 时 也 会 被 
停止 掉 。 在 上 述 步 骤 2 执行 完毕 后 ， 客 户 端 应 用 的 挂 起 状态 被 解除 ， 即 客户 端 可 以 重新 
执行 语句 ， 有 些 着 急 的 用 户 会 在 此 时 再 次 执行 刚刚 被 终止 掉 的 语句 ， 这 又 会 导致 系统 陷 
入 之 前 的 状态 。 为 了 避免 此 种 情况 的 发 生 ， 可 以 采用 直接 终止 连接 的 方式 。 





























PostgreSQL 支持 在 SELECT 查询 语句 中 调用 函数 。 因 此 ， 尽 管 pg_terminate_backend 和 pg_ 
cancel_backend 一 次 仅 能 处 理 一 个 连接 ， 但 你 可 以 通过 在 SELECT 语句 中 调用 函数 的 方式 实 
现 一 次 处 理 多 个 连接 。 例 如 ， 如 果 你 希望 一 次 性 终止 某 个 用 户 的 所 有 连接 ， 那 么 在 9.2 版 
及 之 后 的 版 本 上 可 以 执行 以 下 语句 。 























SELECT pg_terminate_backend(pid) FROM pg_stat_activity WHERE Usename = 
'some_role'; 


在 9.2 版 之 前 的 版 本 上 可 以 执行 以 下 语句 。 





SELECT pg_terminate_backend(procpid) FROM pg_stat_activity WHERE Usename = 
'some_role'; 


从 9.1 版 开始 ，pg_stat_activity 视图 发 生 了 较 大 变化 ， 一 些 字段 的 名 称 发 生 了 变化 ， 并 
且 另 外 新 增 了 一 些 字段 。 原 来 的 procpid 现在 叫 ptd。 


2.3 角色 


PostgreSQL 中 使 用 “角色 ”(role) 这 个 术语 来 表示 用 户 账户 的 概念 。 拥 有 登录 数据 库 权 限 
的 角色 称 为 可 登录 角色 (login role)。 一 个 角色 可 以 继承 其 他 角色 的 权限 从 而 成 为 其 成 员 角 
色 (member role) ; 一 个 拥有 成 员 角 色 的 角色 被 称 为 组 角色 (group role)。 设 计 “ 组 角色 ” 
这 一 功能 的 本 意 是 为 了 将 一 组 权限 集中 在 一 起 成 为 一 个 “组 ”， 然 后 便于 以 “组 ”为 单位 
对 这 些 权限 进行 管理 ， 比 如 可 以 通过 角色 权限 继承 的 方式 一 次 性 将 这 一 组 权限 赋予 其 成 员 
角色 (你 可 能 在 想 ， 一 个 组 角色 能 否 是 另 一 个 组 角色 的 成 员 角 色 ? 没 错 ， 这 是 可 以 的 ， 并 
且 这 种 角色 间 继 承 关系 可 以 有 无 限 多 层 ， 但 除非 你 非常 有 把 握 能 搞定 这 种 多 层 舱 套 关系 ， 
否则 别 这 么 干 ， 因 为 你 最 后 一 定 会 把 自己 搞 糊 涂 )。 一 个 拥有 登录 权限 的 组 角色 被 称 为 可 
登录 的 组 角色 。 然 而 ， 为 了 可 维护 性 和 安全 性 ， 数 据 库 管理 员 一 般 不 会 为 组 角色 授予 登录 
权限 ， 因 为 设计 组 角色 的 本 意 是 将 其 作为 一 个 “权限 集合 ”使 用 ， 而 不 是 将 其 作为 一 个 真 
正 需 要 登录 权限 的 用 户 角色 来 使 用 。 一 个 角色 可 被 授予 超级 用 户 (SUPERUSER) 权限 ， 
拥有 此 权限 的 角色 可 以 对 PostgreSQL 进行 全 面 控 制 。 
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PostgreSQL 从 最 近 的 几 个 版 本 开始 不 再 使 用 “用 户 ” 和 “组 ”这 两 个 术 
语 。 但 在 社区 讨论 版 块 上 你 还 会 看 到 有 人 使 用 这 两 个 术语 ， 请 记 住 “用 户 ” 
和 “组 ”分 别 代表 “可 登录 角色 ”和 “组 角色 ”就 好 了 。 为 保持 前 向 兼容 ， 
CREATE USER 和 CREATE GROUP 这 两 个 命令 在 当前 版 本 中 也 是 支持 的 ， 但 我 们 
建议 最 好 不 要 使 用 它们 ， 请 使 用 CREATE ROLE。 
































2.3.1 创建 可 登录 角色 


在 PostgreSQL 安装 过 程 中 的 数据 初始 化 阶段 ， 系 统 会 默认 创建 一 个 名 为 postgres 的 角 
色 (同时 会 创建 一 个 名 为 postgres 的 同名 database)。 你 可 以 通过 本 书 前 面 曾 介 绍 过 的 
ident 身份 验证 机 制 来 将 操作 系统 的 root 用 户 映射 到 数据 库 的 postgres 角色 ， 这 样 可 以 
实现 root 用 户 无 密码 直接 登录 。 数 据 库 安 装 完成 后 ， 第 一 件 要 做 的 事 就 是 用 psql 或 者 
pgAdmin 工具 以 postgres 角色 身份 登录 ， 然 后 创建 其 他 已 规划 好 的 角色 。pgAdmin 工具 
中 有 专门 的 图 形 界 面 用 于 创建 角色 ， 如 果 你 希望 用 SQL 语句 手动 创建 ， 请 参考 示例 2-4 
中 的 SQL 语句 。 


示例 2-4: 创建 具备 登录 权限 的 角色 


CREATE ROLE Leo LOGIN PASSWORD 'king' CREATEDB VALID UNTIL 'infinity'; 






































VALID 行 是 可 选 的 ， 甚 功 能 是 为 此 角色 的 权限 设 定 有 效 期 ， 过 期 后 所 有 权限 都 将 失效 ， 默 
认 时 限 是 infinity， 即 永 不 过 期 。CREATEDB 修饰 符 表明 为 此 角色 赋予 了 创建 新 数据 库 的 
权限 。 




















如 果 要 创建 一 个 具备 超级 用 户 权限 的 角色 ， 可 以 参考 示例 2-5。 当 然 ， 要 想 创建 一 个 超级 
用 户 ， 创 建 者 自身 也 必须 是 一 个 超级 用 户 。 


示例 2-5: 创建 具备 超级 用 户 权限 的 角色 


CREATE ROLE regina LOGIN PASSWORD 'queen” SUPERUSER VALID UNTIL '2020-1-1 00:00"'; 








上 面 的 语句 中 ， 我 们 创建 了 一 个 拥有 至 高 无 上 权力 的 超级 用 户 “queen”， 但 我 们 又 不 希望 
这 位 “queen” 永 远 “ 统 治 ” 下 去 ， 那 么 怎么 办 呢 ? 用 VALID 子 句 给 她 的 权力 加 一 个 期 限 就 
好 了 。 


2.3.2 创建 组 角色 

一 般 不 应 授予 组 角色 登录 权限 ， 因 为 其 作用 是 将 一 组 权限 汇聚 成 一 个 集合 以 便于 将 这 组 权 
限 批量 授予 别 的 普通 角色 。 当 然 ， 这 只 是 我 们 基于 实践 经 验 给 出 的 建议 ， 你 也 可 以 为 组 角 
色 授 予 登录 权限 ， 这 完全 没 问 题 。 





可 以 用 以 下 SQL 创建 组 角色 。 





CREATE ROLE royaLty INHERIT; 





请 注意 术语 INHERIT 的 用 法 。 它 表示 组 角色 royatty 的 任何 一 个 成 员 角 色 都 将 自动 继承 其 
除 “超级 用 户 权限 ”外 的 所 有 权限 。 出 于 安全 考虑 ，PostgreSQL 不 允许 超级 用 户 权限 通过 
继承 的 方式 传递 。 


以 下 语句 可 以 将 组 角色 的 权限 授予 其 成 员 角 色 。 














GRANT royalty TO leo; 
GRANT royalty TO regina; 


从 组 角色 继承 权限 

PostgreSQL 有 一 个 很 “ 奇 厂 ”( 或 者 从 另 一 个 角度 看 也 可 以 称 之 为 “方便 ") 的 功能 ， 就 是 
禁止 组 角色 将 其 权限 授予 其 成 员 角 色 ， 该 功能 通过 NOINHERIT 关键 字 控 制 。 因 此 ， 创 建 组 
角色 时 请 务必 显 式 指 明 INHERIT 或 者 NOINHERIT 关键 字 ， 如 果 不 指明 就 只 能 依靠 系统 默认 
的 设 定 了 ， 而 这 个 默认 设 定 你 必须 自己 清楚 地 记 住 ， 如 果 记 反 了 必定 会 引发 问题 ， 为 了 避 
免 这 种 事情 的 发 生 ， 我 们 建议 你 还 是 显 式 指明 一 下 。 


有 些 权 限 是 无 法 被 继承 的 ， 例 如 前 面 提 到 过 的 SUPERUSER 超级 用 户 权限 就 无 法 被 继承 ; 
然而 成 员 角 色 可 以 通过 SET ROLE 命令 来 实现 “冒名 顶替 ”其 父 角色 ! 的 身份 ， 从 而 获得 其 
父 角 色 所 拥有 的 SUPERUSER 权限 ， 当 然 这 种 冒名 顶替 的 状态 是 有 期 限 的 ， 仅 限 于 当前 
会 话 存续 期 间 有 效 。 例 如 ，royatty 组 角色 的 成 员 角 色 可 以 通过 执行 以 下 语句 来 实现 上 述 
“冒名 顶替 ”的 目的 。 









































SET ROLE royalty; 


请 记 住 这 种 方法 仅 适 用 于 会 话 存续 期 间 ， 它 不 是 一 种 永久 授权 行为 ， 也 就 是 说 一 旦 会 话 中 
断 ， 成 员 角 色 的 SUPERUSER 权限 就 会 被 收回 。 如 果 和 希望 将 SUPERUSER 权限 永久 授予 革 
些 成 员 角色 ， 只 能 对 他 们 一 个 一 个 手动 授权 。 设 计 这 套 看 似 麻烦 的 机 制 是 为 了 避免 由 于 误 
操作 而 导致 SUPERUSER 权限 被 错误 地 授予 某 个 组 角色 的 所 有 成 员 角 色 ， 而 这 种 情况 是 极 


有 一 个 比 SET ROLE some_role 更 强大 的 命令 ; SET SESSION AUTHORIZATION some_role。 这 
两 条 命令 的 主要 差别 如 下 所 示 。 


。 首先 ， 只 有 具备 SUPERUSER 权限 的 用 户 才 可 以 执行 SET SESSION AUTHORIZATION， 而 
SET ROLE 是 任何 一 个 成 员 角 色 都 可 以 执行 的 。 其 次 ，SET SESSION AUTHORIZATION 能 够 
使 当前 角色 “扮演 ”系统 中 任何 一 个 其 他 角色 ， 即 当前 角色 可 以 拥有 任何 其 他 目标 角色 
的 身份 与 相应 权限 ， 而 不 像 SET ROLE 那样 仅仅 限于 “扮演 ”其 父 角 色 。 







































































注 1: 此 处 首次 提 到 了 “ 父 角色 "， 其 实 就 是 “组 角色 "， 此 话 境 下 用 “ 父 角色 ”更 自然 ， 原 文 亦 使 用 了 


parent role 这 个 称呼 。 一 一 译 者 注 
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。 从 系统 内 部 实现 机 理 上 看 ， 每 个 会 话 会 有 两 个 表示 当前 用 户 身 份 的 环境 变量 : 一 个 是 
session_user， 即 当前 用 户 登 录 时 带 的 原始 身份 ， 一 个 是 current_user， 即 当前 用 户 所 
扮演 的 身份 ， 默认 情况 下 二 者 是 一 致 的 。SET SESSION AUTHORIZATION 命令 会 将 current_ 
user 和 session_user 都 替换 为 所 “扮演 ”角色 的 相应 身份 ID， 而 SET ROLE 命令 只 会 修 
改 current_user， 而 保持 session_user 不 变 。 这 意味 着 SET SESSION AUTHORIZATION 命 
令 会 对 后 续 的 SET ROLE 命令 产生 影响 ， 因 为 原始 身份 session_user 也 发 生 了 变化 ;而 
SET ROLE 命令 不 会 对 后 续 的 SET ROLE 命令 产生 影响 ， 因 为 原始 身份 session_user 未 发 
生变 化 。 

。 假设 某 会 话 的 原始 身份 是 ROLE_A， 即 current_user 和 session_user 都 是 ROLE_A， 然 后 
成 功 地 执行 了 SET SESSION AUTHORIZATION ROLE_B 命令 ， 那 么 current_user 和 session_ 
user 标识 都 被 修改 成 了 ROLE_8B， 之 后 如 果 在 此 会 话 上 再 执行 SET ROLE 命令 的 话 ， 基 础 
身份 就 是 ROLE_B 了 ， 也 就 是 说 此 时 SET ROLE 只 能 设 定 为 ROLE_B 所 归属 的 某 个 组 角色 。 
但 由 于 SET ROLE 并 不 修改 session_user 标识 ， 因 此 在 执行 过 SET ROLE 之 后 再 执行 SET 
ROLE 的 话 ， 后 一 个 SET ROLE 操作 的 基础 身份 是 不 变 的 ， 还 是 当前 的 session_user 角色 。 

















2.4 创建 database 
最 基本 的 创建 数据 库 的 SQL 语句 是 : 





CREATE DATABASE mydb; 








该 命令 会 以 templatel 库 为 模板 生成 一 份 副本 并 将 此 副本 作为 新 database， 每 个 database 都 
会 有 一 个 属 主 ， 这 个 新 库 的 属 主 就 是 执行 此 SQL 命令 的 和 角色。 任何 一 个 拥有 CREATEDB 权 
限 的 角色 都 能 够 创建 新 的 database。 


2.4.1 模板 数据 库 


顾名思义 ， 模板 数据 库 就 是 创建 新 database 时 所 依赖 的 模板 。 创 建新 database 时 ， 
PostgreSQL 会 基于 模板 数据 库 制 作 一 份 副本 ， 其 中 会 包含 所 有 的 数据 库 设置 和 数据 文件 。 


PostgreSQL 安装 好 以 后 默认 附带 两 个 模板 数据 库 ，template9 和 templatel1。 如 果 创 建新 库 
时 未 指定 使 用 哪个 模板 ， 那 么 系统 默认 会 使 用 templatel 库 作为 新 库 的 模板 。 
































切记 ， 任 何 时 候 都 不 要 对 template9 模板 数据 库 做 任何 修改 ， 因 为 这 是 原始 
的 干净 模板 ， 如 果 其 他 模板 数据 库 被 搞 坏 了 ， 基 于 这 个 数据 库 做 一 个 副本 就 
可 以 了 。 如 果 你 希望 定制 自己 的 模板 数据 库 ， 那 么 请 基于 templatel 进行 修 
改 ， 或 者 自己 另外 创建 一 个 模板 数据 库 再 修改 。 对 基于 templatel 或 你 自 建 
的 模板 数据 库 创 建 出 来 的 数据 库 来 说 ， 你 不 能 修改 其 字符 集 编 码 和 排序 规 
则 。 如 果 你 希望 这 么 干 ， 那 么 请 基于 templateo 模板 来 创建 新 数据 库 。 
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基于 某 个 模板 来 创建 新 数据 库 的 基本 语法 如 下 。 





CREATE DATABASE my db TEMPLATE my tempLate_ db; 


你 可 以 使 用 任何 一 个 现存 的 database 作为 创建 新 数据 库 时 的 模板 。 此 外 ， 你 还 可 以 将 某 个 
现存 的 数据 库 标 记 为 模板 数据 库 ， 对 于 这 种 被 标记 为 模板 的 数据 库 ，PostgreSQL 会 禁止 对 
其 进行 编辑 或 者 删除 。 任 何 一 个 具备 CREATEDB 权限 的 角色 都 可 以 使 用 这 种 模板 数据 库 。 以 
超级 用 户 身份 运行 以 下 SQL 可 使 任何 数据 库 成 为 模板 数据 库 。 

















UPDATE pg_database SET datistemplate = TRUE WHERE datname = "mydb '; 
如 果 你 希望 修改 或 者 删除 被 标记 为 模板 的 数据 库 ， 请 先 将 上 述 语句 中 的 datistemplate 字 


段 值 改 为 FALSE， 这 样 就 可 以 放 开 编辑 限制 。 如 有 果 你 还 希望 此 数据 库 作 为 模板 的 话 ， 修 改 
完 后 记得 将 此 字段 值 改 回来 。 




















2.4.2” schema 的 使 用 


schema 可 以 对 database 中 的 对 象 进行 逻辑 分 组 管理 。 如 果 你 的 服务 器 上 有 一 堆 的 database， 
那么 管理 起 来 会 很 麻烦 ， 可 以 考虑 通过 schema 来 对 数据 进行 分 类 并 全 部 存放 到 一 个 
database 中 。schema 中 的 对 象 名 不 人 允许 重复 ， 但 同一 个 database 的 不 同 schema 中 的 对 象 是 
可 以 重 名 的 。 如 果 你 将 数据 库 中 所 有 表 都 塞 到 public schema 中 〈 建 数据 库 时 默认 创建 的 
schema)， 述 早 会 遇 到 对 象 重 名 的 问题 。 你 可 以 自行 决定 如 何 管理 和 组 织 schema。 例 如 : 
假设 要 为 一 家 航空 公司 设计 IT 系统， 那么 可 以 将 飞机 信息 表 及 其 日 常 维护 信 息 表 放 到 一 
个 叫 作 plane 的 schema 中 ， 把 所 有 机 组 人 员 及 其 人 事 信息 放 到 人 事 schema 中 ， 再 创建 一 
个 单独 schema 用 于 记录 乘客 相关 的 信息 ， 这 样 就 把 所 有 信息 分 门 别 类 隔离 开 了 。 


另外 一 种 常见 的 管理 schema 的 方法 是 基于 角色 的 管理 。 当 系统 拥有 多 个 客户 端 并 且 每 个 
客户 端的 数据 必须 完全 隔离 时 ， 这 种 方法 特别 合适 。 





























假设 你 的 工作 是 开发 一 套 “ 完 物 狗 信息 管理 系统 ”并 将 该 在 线 系统 租 赁 给 宠物 狗 SPA 店 使 
用 。 通 过 广告 ,现在 你 有 了 一 些 客户 ， 但 该 系统 的 数据 库 中 目前 仅 用 了 一 张 dogs 表 来 存储 
所 有 完 物 狗 的 信息 。 你 的 系统 前 期 已 经 满足 了 政府 要 求 的 一 堆 稀奇 古怪 的 规定 ， 但 还 有 一 
个 要 求 没 达到 ， 那 就 是 客户 间 数据 必须 完全 隔离 ， 即 必须 得 保证 一 家 SPA 店 看 不 到 另 一 家 
SPA 店 的 宠物 狗 信 息 。 为 了 达到 这 个 要 求 ， 你 可 以 为 每 家 客户 都 建立 一 个 单独 的 schema， 
每 个 schema 中 建立 相同 的 一 张 dogs 表 。 然 后 就 可 以 把 这 些 宠 物 狗 的 数据 从 单一 的 dogs 
表 分 散 到 不 同 schema 的 dogs 表 中 。 最 后 为 每 个 schema 创建 一 个 与 之 同名 的 可 登录 角色 ， 
这 样 就 可 以 实现 各 自 独立 管理 :doggy_day_care schema 归 doggy_day_care 角色 管理 ， 而 
hot_dogs schema 归 hot_dogs 角色 管理 ， 以 此 类 推 。 所 有 的 宠物 狗 信 息 现 在 完全 被 分 散 到 
它们 对 应 的 SPA 店 的 schema 下 。 当 店家 的 客户 端 登 录 到 你 的 数据 库 并 进行 数据 编辑 时 ， 
每 家 店 就 只 能 访问 他 们 各 自 schema 中 的 数据 。 
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别 急 ， 到 这 儿 还 没完 ， 后 面 还 有 更 妙 的 用 法 。 我 们 之 前 让 角色 和 schema 同名 ， 这 样 就 可 
以 用 上 另外 一 种 很 有 用 的 技巧 ， 在 介绍 这 个 技巧 之 前 需要 先 介绍 一 下 search_path 这 个 系 


-四 
统 变 量 。 


我 们 之 前 已 经 说 过 ，schema 中 的 对 象 是 不 允许 重 名 的 ， 但 不 同 schema 中 的 对 象 就 可 
以 。 例 如 ， 在 所 有 12 个 schema 中 都 有 一 张 同 名 的 dogs 表 。 那 么 问题 来 了 ， 当 执行 类 
似 SELECT * FROM dogs 这 种 语句 时 ，PostgreSQL 是 怎么 知道 要 查 的 是 哪个 schema 中 的 表 
呢 ? 这 个 问题 最 简单 的 解决 办 法 是 在 表 名 前 加 上 所 属 schema 的 名 称 ， 比 如 SELECT * FROM 
doggy_day_care.dogs; 另 一 种 方法 是 通过 设置 search_path 变量 来 解决 ， 比 如 可 以 设 定 为 : 
pubLic,doggy_day_care,hot_dogs。 当 执行 查询 语句 时 ， 规 划 器 会 按照 从 public schema 到 
doggy_day_care Schema 再 到 hot_dogs schema 的 顺序 来 寻找 dogs 表 。 








PostgreSQL 有 一 个 少 为 人 知 的 系统 变量 叫 作 user， 它 代表 了 当前 登录 用 户 的 名 称 。 执 行 
SELECT user 就 能 看 到 其 名 称 。 


我 们 前 面 将 schema 的 名 称 取得 和 登录 用 户 名 一 致 ， 现 在 可 以 充分 利用 这 一 点 了 ， 接 下 来 
在 postgresql.conf 中 将 search_path 变量 设 成 下 面 这 样 。 





search_path = "$user", public; 


好 了 ， 如 果 当 前 登录 的 角色 是 doggy_day_care， 那 么 所 有 的 查询 都 会 优先 去 doggy_day_ 
care Schema 中 寻找 目标 表 ， 如 果 找 不 到 才 会 去 public schema 下 找 。 最 重要 的 一 点 是 ， 
这 样 我 们 系统 中 的 SQL 语句 就 只 需要 一 种 写法 ， 而 不 用 在 每 个 客户 的 SQL 中 加 上 对 应 
的 schema 名 。 这 样 就 算 你 的 客户 数 增长 到 几 千 个 其 至 是 儿 十 万 个 也 没关系 ， 系 统 中 所 
有 的 SQL 语句 都 不 需要 修改 。 为 了 让 整个 业务 体系 进一步 简化 ， 你 可 以 建立 一 个 空 模板 
数据 库 ， 这 样 新 增 客户 的 时 候 只 需要 为 此 客户 执行 简短 几 个 步骤 即 可 :创建 好 schema、 
database、 角 色 以 及 空 的 业务 表 就 行 了 。 


我 们 强烈 推荐 为 每 一 个 扩展 包 创 建 一 个 单独 schema 来 容纳 其 对 象 。 安 装 一 个 新 的 扩展 包 
时 ， 会 在 数据 库 服 务 器 上 创建 大 量 的 表 、 函 数 、 数 据 类 型 以 及 其 他 对 象 。 默 认 情 况 下 它们 
都 会 被 安装 到 public schema 中 ， 这 样 日 积 月 累 之 后 public schema 里 面 会 被 搞 得 一 团 糟 。 
例如 ， 完 整 的 PostGIS 扩展 包 安 装 后 会 创建 超过 1000 个 国 数 ， 如 果 你 此 前 已 经 在 public 
schema 中 创建 了 一 些 自己 的 表 和 函数 ， 可 以 想象 一 下 ， 在 加 进来 这 上 千 个 表 和 函数 后 ， 要 
从 中 找到 属于 你 自己 的 那些 是 多 么 痛 匣 的 一 件 事情 | 


在 安装 扩展 包 之 前 ， 先 为 其 创建 一 个 schema。 









































CREATE SCHEMA my_extensions; 
然后 把 这 个 新 的 schema 加 入 search_path: 


ALTER DATABASE mydb SET search_path='"$user", public, my extensions'; 
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安装 扩展 包 时 ， 记 得 在 CREATE EXTENSION 语句 中 将 你 为 其 创建 的 新 schema 声明 为 其 归属 


Schema。 








对 于 现 有 连接 来 说 ，SET search_path 命令 执行 后 是 不 能 直接 生效 的 ， 你 需要 
断 开 此 连接 并 重 连 才 可 以 。 


2.5 ”权限 管理 


PostgreSQL 的 权限 管理 机 制 非常 灵活 而 自由 ， 因 此 要 想 管理 得 当 是 很 需要 一 些 技巧 的 。 比 
如 ， 权 限 控制 可 精确 到 数据 库 对 象 级 别 ， 如 有 必要 甚至 可 以 针对 同一 张 表 的 不 同 字段 分 别 
单独 设 定 其 权限 。 要 想 完整 地 介绍 所 有 关于 权限 管理 的 知识 可 能 会 需要 好 几 音 的 篇 幅 ， 因 
此 我 们 在 本 市 中 仅 介 绍 能 让 你 达到 正常 使 用 程度 所 必 备 的 知识 ， 同 时 会 指导 你 避 开 一 些 隐 
蔽 的 “ 雷 区 "， 这 些 “ 雷 ”一 旦 踩 到 ， 会 导致 要 么 你 根本 无 法 访问 想 要 访问 的 内 容 ， 要 么 
服务 器 上 的 数据 得 不 到 有 效 防护 。 


























请 参考 官方 手册 中 “权限 管理 ”章节 (http:Wwww.postgresql.org/docs/currenUinteractive/ddl- 
priv.html) 来 了 解 权 限 管理 体系 的 概要 。 














做 好 PostgreSQL 的 权限 管理 可 不 是 件 很 轻松 的 活 。 利 用 pgAdmin 工具 的 图 形 化 界面 来 进 
行 操作 会 简单 一 些 ,或 者 说 至 少 能 让 你 比较 清楚 地 了 人 解 到 系统 当前 权限 设置 的 全 貌 。 通 
过 pgAdmin 可 以 完成 绝 大 多 数 权 限 管理 工作 。 如 果 你 得 负责 权限 管理 工作 而 你 又 是 个 
PostgreSQL 新 手 ， 那 么 建议 使 用 这 个 工具 。 如 果 等 不 了 我 们 按部就班 的 慢 慢 介绍 ， 你 也 可 
以 直接 跳 到 4.2.3 节 去 学 习 。 






































2.5.1 权限 的 类 型 

PostgreSQL 中 支持 的 对 象 级 权限 包括 SELECT、INSERT、UPDATE、ALTER、 EXECUTE、TRUNCATE 
等 以 及 一 个 附带 的 WITH GRANT 修饰 符 。 除 了 GRANT 外 ， 前 几 类 权限 都 可 顾名思义 猜 到 其 含 
义 ，GRANT 的 用 法 在 2.5.3 节 中 会 专门 介绍 。 请 注意 ， 每 种 权限 都 有 其 适用 的 数据 库 资 产 类 
型 ， 比 如 对 于 函数 来 说 TRUNCATE 权限 毫 无 意义 ， 对 表 来 说 EXECUTE 权限 也 无 意义 。 

















2.5.2 入门 介绍 
假设 你 已 安装 好 PostgreSQL， 建 好 了 一 个 超级 用 户 角色 并 设 定好 了 密码 。 请 参照 以 下 步 又 
来 建立 其 他 角色 并 设 定 其 权限 。 




















(1) PostgreSQL 在 安装 阶段 会 默认 创建 一 个 超级 用 户 角色 以 及 一 个 database， 二 者 的 名 称 都 
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是 postgres。 请 以 postgres 身份 登录 服务 器 


(2) 在 创建 你 自己 的 首 个 database 之 前 ， 需 要 先 建 一 个 角色 作为 此 database 的 所 有 者 ， 所 有 
者 可 以 登录 该 库 。 话 法 如 下 : 








CREATE ROLE mydb_admin LOGIN PASSWORD 'something'; 


(3) 创建 database 并 设 定 其 所 有 者 : 














CREATE DATABASE mydb NITH owner = mydb_admin; 


(4) 然后 用 mydb_admin 身份 登录 并 创建 schema 和 表 。 





2.5.3 GRANT 
GRANT 命令 可 以 将 权限 授予 他 人 。 基 本 用 法 如 下 。 


GRANT some _ privilege TO some_role; 
请 牢记 以 下 几 条 关于 GRANT 的 使 用 原则 。 


。 只 有 权限 的 拥有 者 才能 将 权限 授予 别人 ， 并 且 拥 有 者 自身 还 得 有 GRANT 操作 的 权限 。 这 
一 点 是 不 言 而 喻 的 ， 因 为 自己 没有 的 东西 当然 给 不 了 别人 。 

。 有 些 权限 只 有 对 象 的 所 有 者 才能 拥有 ， 任 何 情况 下 都 不 能 授予 别人 。 这 类 权限 包括 
DROP 和 ALTER 。 

。 对 象 的 所 有 者 天然 拥 有 此 对 象 的 所 有 权 际 ， 不 需要 再 次 授予 。 

。 授权 时 可 以 加 上 MITH GRANT 子 句 ， 这 意味 着 被 授权 者 可 以 将 得 到 的 权限 再 次 授予 别人 
示例 如 下 。 
































GRANT ALL ON ALL TABLES IN SCHEMA public TO mydb_admin NITH GRANT OPTION; 





。 如 果 希 望 一 次 性 将 某 个 对 象 的 所 有 权限 都 授予 其 人 ， 可 以 使 用 ALL 关键 字 ， 而 不 需要 一 
个 个 权限 都 写 下 来 *。 


GRANT ALL ON my_schema.my_table TO mydb admin; 
。 ALL 关键 字 还 可 以 用 于 指 代 某 个 database 或 者 schema 中 的 所 有 对 象 。 
GRANT SELECT，UPDATE ON ALL SEQUENCES IN SCHEMA my_schema TO PUBLIC; 


。 如 果 和 希望 将 权限 授予 所 有 人 ， 可 以 用 PUBLIC 关键 字 来 指 代 所 有 角色 。 


GRANT USAGE ON SCHEMA my_schema TO PUBLIC; 





注 2: 原文 此 处 示例 不 妥 ， 我 做 了 修改 。 一 一 译 者 注 





官方 手册 的 “GRANT” 章节 (http:/www.postgresql.org/docs/currentinteractive/sql-grant. 
html) 中 对 GRANT 命令 的 所 有 细 节 都 有 极其 详尽 的 说 明 ， 我 们 强烈 推荐 你 先 认 真 阅读 一 下 
此 章节 ， 以 免 不 小 心 设 错 权限 导致 系统 安全 隐患 


默认 情况 下 会 将 某 些 权限 授予 PUBLIC。 这 些 权限 包括 : CONNECT、CREATE TEMP TABLE ( 针 
对 数据 库 )、EXECUTE (针对 函数 ) 以 及 USAGE (针对 语言 )。 有 些 情况 下 出 于 安全 考虑 ， 你 
可 能 希望 取消 一 些 默 认 权 限 ， 那 么 可 以 使 用 REVOKE 命令 : 








REVOKE EXECUTE ON ALL FUNCTIONS IN SCHEMA my_schema FROM PUBLIC; 


2.5.4 默认 权限 


从 PostgreSQL 9.0 版 开始 引入 了 默认 权限 ， 使 用 默认 权限 ， 用 户 可 以 一 次 性 针对 某 个 特定 
schema 或 database 中 的 所 有 数据 库 资 产 进行 权限 设置 操作 ， 哪 怕 这 些 资产 还 没 创建 。 如 果 
你 的 默认 权限 更 新 及 时 ， 那 么 这 样 可 以 大 大 简化 权限 管理 工作 。 


假设 我 们 希望 对 所 有 数据 库 用 户 都 授予 某 schema 中 所 有 函数 和 表 的 EXECUTE 和 SELECT 权 
限 ， 那 么 我 们 可 以 按 示例 2-6 这 样 来 定义 权限 。 


示例 2-6: 定义 schema 的 默认 权限 


GRANT USAGE ON SCHEMA my_schema TO PUBLIC; 
ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT SELECT, REFERENCES ON TABLES TO PUBLIC; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT ALL ON TABLES TO mydb_admin WITH GRANT OPTION; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT SELECT, UPDATE ON SEQUENCES TO public; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT ALL ON FUNCTIONS TO mydb_admin WITH GRANT OPTION; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT USAGE ON TYPES TO PUBLIC; 


新 增 或 者 修改 默认 权限 并 不 会 影响 已 有 的 权限 设置 ， 即 只 有 当 某 个 对 象 的 某 
项 权限 未 专门 设 定 的 情况 下 ， 默 认 权限 设 定 才 会 生效 。 





要 了 解 更 多 关于 默认 权限 的 信息 ， 请 参考 官方 手册 中 “修改 默认 权限 ”这 一 节 (http:/ 


www.postgresql.org/docs/current/interactive/sql-alterdefaultprivileges.html) 的 内 容 。 
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2.5.5 ”PostgreSQL 权 限 体系 中 一 些 与 众 不 同 的 特点 
最 后 ， 在 你 自己 去 次 入 学 习 了 解 权 限 管理 体系 之 前 ， 我 们 会 给 你 列举 一 些 比 较 隐 蔽 的 “ 奇 
范 ”特性 。 


在 一 般 的 数据 库 中 ， 一 个 database 的 所 有 者 会 对 此 库 中 的 所 有 对 象 都 拥有 完全 的 控制 权 ， 
但 PostgreSQL 不 一 样 ， 一 个 database 的 所 有 者 仅 对 自己 在 本 库 中 所 创建 的 对 象 拥有 控制 
权 ， 对 其 他 角色 在 本 库 中 所 创建 的 对 象 却 没有 访问 权限 。 矛 盾 的 是 ， 所 有 者 却 又 有 权能 删 
掉 整 个 库 。 比 如 另 一 个 角色 在 你 的 库 中 创建 了 某 个 对 象 ， 你 虽然 身 为 此 库 的 所 有 者 却 无 权 
访问 这 些 对 象 ， 然 后 此 时 你 却 可 以 把 整个 库 都 删 掉 。 总 体 来 看 ， 这 种 情况 是 比较 奇怪 的 。 
































人 们 常常 会 忘记 执行 GRANT USAGE ON SCHEMA 或 者 GRANT ALL ON SCHEMA 语句 来 为 Schema 对 
象 进行 使 用 授权 。 但 其 实 这 个 步骤 是 必要 的 ， 因 为 在 PostgreSQL 中 ， 即 使 已 经 将 schema 
中 的 表 和 函数 的 访问 权限 授予 某 个 角色 ， 在 没有 此 schema 的 USAGE 权限 的 情况 下 ， 此 角色 
依然 不 能 访问 此 schema 中 的 表 或 者 函数 对 象 。 


2.6 扩展 包机 制 


扩展 包 (extension) 是 一 种 用 于 扩展 PostgreSQL 系统 功能 的 插件 机 制 ， 该 机 制 的 前 身 被 称 
为 “contrib>”*。 访 机制 很 好 地 体现 了 开源 界 的 强大 优势 ; 人 们 互相 协作 、 共同 开发 并 自由 分 
享 新 的 功能 特性 。 自 从 9.1 版 开始 引入 对 extension 扩展 包机 制 的 支持 以 来 ， 目 前 它 已 经 发 
展 得 非常 成 熟 ， 这 使 得 为 PostgreSQL 添加 功能 插件 变 得 非常 方便 快捷 。 











对 于 在 extension 扩展 包机 制 推 出 之 前 就 已 存在 的 那些 历史 插件 ， 理 论 上 我 们 
应 称 之 为 “contrib” 以 示 差 别 ， 但 放眼 未 来 ， 这 些 老 的 contrib 势必 都 会 被 改 
造 为 用 extension 机 制 实现 。 为 了 描述 方便 ， 下 文 会 将 二 者 统称 为 “扩展 包 ”， 
但 你 应 该 清楚 二 者 的 区 别 。 























对 于 一 台 PostgreSQL 服务 器 来 说 ， 并 不 是 其 中 每 个 database 都 要 安装 全 部 的 扩展 包 ， 只 
当 某 个 database 的 确 需要 此 扩展 包 提 供 的 功能 时 才 应 安装 。 如 果 你 的 PostgreSQL 服务 器 上 
的 所 有 database 都 需要 某 些 扩展 包 的 功能 ， 那 么 可 以 新 建 一 个 模板 数据 库 (有 关 模 板 数据 
库 的 介绍 ， 请 参见 2.4.1 节 )， 然 后 在 此 模板 数据 库 中 预先 安装 好 这 些 扩 展 包 ， 那 么 后 续 的 
database 就 能 以 此 模板 数据 库 为 基础 来 创建 ， 这 样 就 避免 了 每 新 建 一 个 database 就 需要 再 
安装 一 遍 扩展 包 的 有 麻烦 。 
































注 3: extension 与 contrib 本 质 上 都 是 PostgreSQL 的 系统 功能 插件 ， 二 者 功能 类 似 但 实现 机 制 有 很 大 差 
异 ， 其 版 本 分 界 点 为 9.1 版 ， 之 前 的 插件 机 制 被 称 为 contrib，9.1 版 及 之 后 的 插件 机 制 被 称 为 














extension。 
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建议 定期 检查 并 务 载 掉 已 经 不 再 需要 的 扩展 包 以 避免 系统 过 于 腾 肿 ， 因 为 有 的 扩展 包 需 要 
占用 相当 大 的 空间 。 


可 以 通过 示例 2-7 中 的 语句 来 查看 系统 中 已 经 安装 了 哪些 扩展 包 。 你 的 查询 结果 可 能 和 
我 们 在 下 面 列 出 的 很 不 一 样 ， 这 是 正常 的 ， 因 为 每 台数 据 库 服务 器 的 具体 情况 可 能 都 不 
一 样 。 


示例 2-7: 服务 器 上 已 安装 的 扩展 

SELECT name, default version, installed version, left(comment,30) As comment 
FROM pg_available _ extensions 

WHERE installed_version IS NOT NULL 

ORDER BY name; 








name | def | installed | Com 

--------------- 4 
btree_gist | 1.0 | 1.0 | support for indexing common datatypes in. . 
fuzzystrmatch | 1.0 | 1.0 | determine similarities and distance betw. . 
hstore | a le ep | data type for storing sets of (key, valu.. 
plpgsql | 1.0 | 1.0 | PL/pgSQL procedural language.. 

plv8 | 1.3.0 | 1.3.0 | PL/JavaScript (v8) trusted procedural la.. 
postgis | L3123173 | PostGIS geometry, geography, and raster .. 
www_fdw | 0.1.8 | 0.1.8 | WWW FDW - extension for handling differe.. 


如 果 想 要 了 人 解 系 统 中 某 个 已 安装 的 扩展 包 的 更 多 详细 内 容 ， 请 在 psql 中 执行 类 似 以 下 的 


命令 : 
\dx+ fuzzystrmatch 
或 者 执行 以 下 查询 也 可 以 : 


SELECT pg_cataLog.pg_describe_object(d.cLassid，d.objid，0) AS description 

FROM pg_catatLog.pg_depend AS D INNER JOIN pg_catalog.pg_extension AS E 

ON D.refobjid = E.oid 

WHERE D.refclassid = 'pg_catalog.pg_extension'::pg_catalog.regclass AND deptype 
= 'e' AND E.extname = 'fuzzystrmatch'; 


查询 结果 显示 了 该 扩展 包 中 包含 了 哪些 内 容 : 


description 

function dmetaphone_alt(text) 

function dmetaphone(text) 

function difference(text,text) 

function text_soundex(text) 

function soundex(text) 

function metaphone(text,integer) 

function levenshtein_ less _ equal(text,text,integer,integer,integer,integer) 
function levenshtein less_ equal(text,text,integer) 
function levenshtein(text,text,integer,integer,integer) 
function levenshtein(text,text) 
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扩展 包 中 可 以 包含 各 类 数据 库 资 产 ， 包 括 : 函数 、 表 、 数 据 类 型 、 数 据 类 型 转换 器 、 编 程 
语言 、 运 算 符 类 ， 等 等 。 但 函数 通常 被 认为 是 有 效 负载 的 大 部 分 。 


2.6.1 扩展 包 的 安装 
将 扩展 包 安 装 到 系统 中 需要 两 个 步骤 : 首先 ， 下 载 安装 包 并 安装 到 数据 库 服务 器 上 ， 其 
次 ， 将 此 扩展 包 安 装 到 目标 database 中 。 








我 们 在 前 述 两 个 步骤 中 都 使 用 了 “安装 ”这 个 词 ， 但 其 指 代 的 具体 动作 是 不 
一 样 的 ， 当 上 下 文 环境 不 清楚 时 ， 我 们 会 加 以 描述 区 


y 








o 





以 下 我 们 将 介绍 扩展 包 的 安装 方法 ， 同 时 也 将 介绍 在 不 支持 extension 扩展 包机 制 的 老 版 本 
PostgreSQL 上 安装 contrib 扩展 包 的 方法 。 


1. 步骤 一 : 将 扩展 包 安 装 到 数据 库 服务 器 

这 一 步 的 具体 做 法 会 根据 操作 系统 的 不 同 而 有 所 不 同 。 总 的 来 说 就 是 先 下 载 该 扩展 包 的 安 
装 文件 以 及 该 扩展 包 所 依赖 的 库 文 件 ， 然 后 将 它们 分 别 复 制 到 操作 系统 的 bn 和 lib 文件 
夹 ， 同 时 把 SQL 脚本 文件 复制 到 share/extension 文件 夹 (9.1 版 及 之 后 版 本 ) 或 者 share/ 
contrib 文件 夹 (9.1 版 之 前 的 版 本 ) 。 这 样 就 为 接 下 来 执行 第 二 步 做 好 了 准备 。 


对 于 较 小 的 扩展 包 来 说 ， 其 所 需 的 很 多 库 文件 在 PostgreSQL 安装 好 以 后 就 有 了 ， 或 者 没有 
的 话 也 可 以 通过 yum 或 apt get postgresql-contrib 命令 较 容 易 地 获取 到 。 对 于 通过 以 上 
方式 获取 不 到 的 库 文件 ， 你 要 么 自行 编译 ， 要 么 找 一 下 别人 已 经 编译 好 的 安装 包 ， 要 么 从 
另 一 台 环 境 完全 相同 的 服务 器 上 把 库 文 件 复 制 过 来 。 对 于 PostGIS 这 类 较 大 的 扩展 包 ， 通 
常 可 以 从 你 下 载 PostgreSQL 的 站 点 下 载 到 完整 安装 包 。 如 果 想 了 解 当 前 服务 器 上 有 哪些 扩 
展 包 可 用 ， 请 执行 以 下 命令 : 




















SELECT * FROM pg_available extensions; 


2. 步骤 二 : 将 扩展 包 安装 到 数据 库 中 〈9.1 版 之 前 的 做 法 ) 

在 9.1 版 之 前 ， 安 装 contrib 扩展 包 时 需要 在 数据 库 上 手工 执行 一 些 SQL 脚本 。 一 般 来 说 ， 
如 果 你 下 载 的 扩展 包 是 一 个 可 安装 的 程序 ， 那 么 执行 此 程序 后 会 自动 将 附加 的 脚本 转 储 
到 PostgreSQL 安装 路 径 下 的 contrib 文件 夹 中 。 该 路 径 的 具体 位 置 可 能 会 随 着 操作 系统 和 
PostgreSQL 版 本 的 不 同 而 有 所 不 同 。 


例如 ， 对 于 CentOS 上 的 PostgreSQL 9.0 版 来 说 ， 执 行 pgAdmin 扩展 包 安 装 脚本 的 命令 行 
如 下 : 








psql -p 5432 -d postgres -f /usr/pgsql-9.0/share/contrib/adminpack.sql 
该 命令 会 以 非 交互 方式 调用 psql 来 执行 一 个 SQL 脚本 。 


contrib 与 extension 还 有 一 个 重要 差别 ， 那 就 是 contrib 机 制 不 支持 对 扩展 包 信 息 进 行 查 询 ， 
比如 查询 已 安装 哪些 扩展 包 以 及 有 哪些 安装 包 可 安装 等 。 


3. 步骤 二 : 将 扩展 包 安装 到 数据 库 中 〈9.1 版 及 之 后 版 本 的 做 法 ) 

9.1 版 引入 的 extension 扩展 包机 制 使 得 安装 过 程 更 加 简单 和 连贯 。 使 用 CREATE EXTENSION 
命令 即 可 将 扩展 包 安 装 到 指定 的 database 中 。 相 比 原来 的 安装 方法 ， 该 新 机 制 有 三 大 主要 
优点 : 首先 ， 用 户 不 需要 和 弄 清楚 扩展 包 文件 存放 的 具体 路 径 (share/extension) ; 其 次 ， 可 
以 通过 DROP EXTENSION 命令 方便 地 外 载 扩展 包 ， 最 后 ， 支 持 查看 当前 已 安装 和 可 安装 的 扩 
展 包 列表 。PostgreSQL 安装 包 中 已 经 附带 了 最 常用 的 若干 扩展 包 ， 因 此 安装 时 你 仅 需 执行 
CREATE EXTENSION 命令 来 安装 即 可 。 通 过 PostgreSQL Extension Network 站 点 (http://pgxn. 
org/) 可 以 下 载 到 PostgreSQL 安装 包 中 默认 未 附带 的 扩展 包 。 











以 下 是 安装 fuzzystrmatch 扩展 包 的 命令 : 
CREATE EXTENSION fuzzystrmatch; 


你 仍 可 以 使 用 psql 以 非 交 互 方式 安装 扩展 包 。 先 连接 到 需要 安装 此 扩展 包 的 database， 然 
后 执行 类 似 以 下 命令 行 : 





psql -p 5432 -d mydb -c "CREATE EXTENSION fuzzystrmatch;" 


基于 C 语言 的 扩展 包 必 须 由 具备 超级 用 户 权限 的 角色 来 安装 。 大 多 数 扩展 包 
都 是 基于 C 语言 的 。 








我 们 建议 你 创建 专门 的 schema 来 安装 扩展 包 ， 以 确保 扩展 包 数 据 与 业务 数据 隔离 。 建 好 
schema 后 ， 执 行 以 下 命令 来 将 其 指定 给 待 安 装 的 扩展 包 : 








CREATE EXTENSION fuzzystrmatch SCHEMA my_extensions; 


4. 升级 PostgreSQL 版 本 以 支持 新 的 extension 扩 展 包机 制 

如 果 你 从 PostgreSQL 9.1 版 或 者 更 早 的 版 本 升级 到 了 9.1 版 或 者 之 后 的 版 本 ， 并 且 也 正确 
地 将 数据 从 老 版 本 导入 到 了 新 版 本 之 中 ， 那 么 之 前 安装 的 那些 contrib 扩展 包 依然 是 可 以 正 
常 工作 的 。 但 为 了 简化 管理 并 提升 可 维护 性 ， 你 应 该 在 contrib 文件 夹 中 升级 你 的 旧 扩 展 包 
以 对 扩展 包 使 用 新 的 方法 。 这 种 格式 升级 是 完全 可 以 实现 的 ， 尤 其 是 对 那些 随 PostgreSQL 
版 本 附带 的 扩展 包 来 说 更 加 没 问题 。 不 过 请 注意 ， 这 里 说 的 “升级 ”是 指 从 contrib 格式 到 
extension 格式 的 “格式 升级 ”"， 而 不 是 指 扩展 包 本 身 的 “功能 升级 ”。 
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例如 ， 如 果 你 之 前 在 一 套 PostgreSQL 9.0 版 的 contrib schema 中 安装 了 tablefunc 扩展 包 
(这 是 一 个 用 于 实现 跨 表 查询 的 功能 插件 )， 然 后 你 将 该 系统 升级 到 了 9.1 版 。 那 么 可 以 执 
行 以 下 命令 来 升级 此 插件 : 





CREATE EXTENSION tablefunc SCHEMA contrib FROM unpackaged; 


该 命令 会 搜索 contrib schema， 找 到 所 有 属于 tablefunc 插件 的 成 员 对 象 ， 然 后 把 它们 
按照 新 的 extension 扩展 包 模 型 格式 进行 封装 ， 这 样 该 扩展 包 就 会 出 现在 pg_available_ 
extensions 视图 信息 中 ， 就 好 像 是 全 新 安装 的 一 个 extension 扩展 包 一 样 。 这 样 就 实现 了 从 
contrib 到 extension 的 扩展 包 格 式 升 级 。 


该 命令 会 将 contrib schema 中 的 插件 函数 按 extension 模式 进行 封装 格式 升级 ， 函 数 本 身 不 
会 有 任何 改动 ， 但 此 后 该 database 进行 备份 时 不 会 包含 这 些 函 数 ， 因 为 它们 的 身份 已 经 发 
生 了 变化 ， 从 与 别 的 函数 身份 无 法 区 分 的 普通 函数 变 为 extension 扩展 包 中 的 函数 。 


你 仍 可 以 使 用 psql 在 某 个 数据 库 中 安装 扩展 包 ， 而 不 必 首 先 连接 到 该 数据 库 。 

















psql -p 5432 -d mydb -c "CREATE EXTENSION fuzzystrmatch;" 


2.6.2 通用 扩展 包 

通用 扩展 包 是 指 那些 因 功 能 比较 基本 和 通用 而 在 PostgreSQL 安装 包 中 默认 附带 的 一 些 
扩展 包 ， 但 它们 不 一 定 会 被 默认 安装 ， 有 具体 视 其 功能 而 定 。 有 些 早 期 的 通用 扩展 包 已 被 
PostgreSQL 内 核 接纳 从 而 “ 登 堂 入 室 ” 成 为 系统 基础 功能 ， 因 此 如 果 你 是 从 较 老 版 本 的 
PostgreSQL 升级 上 来 的 话 ， 可 能 会 发 现 原先 要 通过 安装 扩展 包 才 能 实现 的 功能 现在 已 成 了 
系统 默认 提供 的 功能 。 


1. 比较 常用 的 扩展 包 介 绍 

从 9.1 版 开始 ，PostgreSQL 官方 推荐 开发 人 员 使 用 extension 扩展 包 模 式 来 为 系统 制作 功能 
插件 。 从 仅 包含 函数 和 数据 类 型 的 基本 插件 到 包含 了 存储 过 程 语言 支持 (PL)、 索 引 类 型 
以 及 外 部 数据 封装 器 的 高 级 插件 ， 都 可 以 用 extension 扩展 包机 制 来 实现 。 本 节 我 们 列举 了 
最 常用 (也 有 些 人 称 之 为 “ 必 备 ”) 但 默认 情况 下 PostgreSQL 并 未 安装 的 一 些 扩 展 包 。 你 
会 发 现下 面 列 出 的 很 多 扩展 包 在 你 的 PostgreSQL 系统 中 已 经 有 了 ， 具 体 哪些 会 有 哪些 没有 
取决 于 你 使 用 的 是 哪个 PostgreSQL 发 行 版 ， 不 同 发 行 版 之 间 可 能 会 略 有 差异 。 







































































。 btree_gist (http:Wwww.postgresql.org/docs/currenUinteractive/btree-gisthtml) 
该 扩展 包 实现 了 基于 B- 树 索引 算法 的 GiST 索引 运算 符 类 ， 适用 于 B- 树 索引 支持 的 所 
有 数据 类 型 ， 其 具体 效果 与 标准 的 B- 树 索引 类 似 。 更 多 细节 请 参见 6.3.1 节 的 内 容 。 





。 btree_gin (http:/www.postgresql.org/docs/currenUinteractive/btree-gin.html) 


该 扩展 包 实 现 了 基于 B- 树 索 引 算 法 的 GIN 索引 运算 符 类 ， 适用 于 B- 树 索引 支持 的 所 
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有 数据 类 型 ， 其 具体 效果 与 标准 的 B- 树 索 引 类 似 。 更 多 细节 请 参见 6.3.1 市 的 内 容 。 


postgis (http://postgis.net/) 

该 扩展 包 将 PostgreSQL 提升 为 一 个 业界 最 先进 的 空间 数据 库 ， 胜 过 了 所 有 类 似 的 商业 
化 产品 。 如 果 你 需要 处 理 标准 的 OGC GIS 数据 ， 或 者 人 口 统计 学 数据 ， 又 或 者 地 理 
编码 数据 ， 那 么 postgis 会 是 你 的 必 备 之 选 。 我 们 编写 的 图 书 PostG7S in Action (http:// 
www.postgis.us/) 中 对 PostGIS 做 了 更 加 详尽 的 介绍 。PostGIS 是 扩展 包 界 的 “ 巨 无 
霸 "， 它 包含 800 多 个 国 数 、 自 定义 数据 类 型 以 及 空间 索引 等 对 象 。 



































fuzzystrmatch (http://www.postgresql.org/docs/current/interactive/fuzzystrmatch.htm]l) 
这 是 一 个 用 于 字符 串 模 糊 匹配 的 轻 量 级 扩展 包 ， 包 含 了 诸如 soundex、levenshtein 和 
metaphone 等 国 数 。 我 们 在 “soundex 等 模糊 匹配 国 数 在 PostgreSQL 中 如 何 实现 ”这 
篇 文 章 (http:/www.postgresonline.com/journal/archives/158-Where-is-soundex-and-other- 
warm-and-fuzzy-string-things.html) 中 介绍 了 该 扩展 包 的 用 法 。 





hstore (http:Wwww.postgresql.org/docs/currenUinteractive/hstore.html) 

该 扩展 包 为 PostgreSQL 添加 了 对 键 值 数据 库 的 支持 ， 同 时 也 支持 索引 ， 非 常 适用 于 存 
储 非 结构 化 数据 。 如 果 你 正在 寻找 一 种 介 于 关系 型 数据 库 和 NOSQL 数据 库 之 间 的 产 
品 ， 可 以 尝试 一 下 hstore。 
































pg_ trem (trigram, http://www.postgresql.org/docs/current/interactive/pgtrgm.htm!l) 

该 扩展 包 提供 了 另外 一 种 字符 串 模 糊 搜 索 算法 库 ， 可 与 fuzzystrmatch 配合 使 用 。 在 9.1 
版 中 ， 该 扩展 包 新 增 了 一 种 运算 符 类 ， 使 得 基于 ILIKE 的 搜索 操作 能 用 上 索引 。 该 扩 
展 还 能 够 让 形 如 LIKE '%something%' 的 通配符 查询 能 用 上 索引 。 关 于 这 部 分 内 容 ， 在 
“ILIKE 和 LIKE 操作 的 新 技巧 介绍 ”这 篇 博文 (http://www.postgresonline.com/journal/ 
archives/212-PostgreSQL-9.1-Trigrams-teaching-LIKE-and-ILIKE-new-tricks.html) 中 有 更 
深入 的 探讨 。 








dblink (http:/www.postgresql.org/docs/current/interactive/dblink.htm!l) 

该 扩展 包 支 持 从 一 台 PostgreSQL 服务 器 远程 访问 男 一 台 PostgreSQL 服务 器 上 的 数据 。 
在 9.3 版 中 引入 对 外 部 数据 源 的 支持 之 前 ，dblink 是 唯一 能 够 实现 跨 数 据 库 交 互 的 机 制 。 
目前 该 机 制 一 般 用 于 需要 临时 性 连接 到 外 部 数据 源 或 者 临时 的 即席 查询 场景 。 例 如 ， 如 
有 果 我 们 需要 从 备份 数据 中 找 回 一 些 被 误 删 的 数据 ， 那 么 我 们 一 般 会 用 dblink 来 连接 到 依 
据 备份 的 数据 恢复 出 来 的 老 版 本 数据 库 。 






































pgcrypto (http:Wwww.postgresql.org/docs/currenUinteractive/pgcrypto.html) 

该 扩展 包 提 供 了 一 系列 的 加 密 工具 ， 包 括 使 用 广泛 的 PGP 算 法。 使 用 该 扩展 包 提 供 
的 功能 来 对 数据 库 中 存储 的 信用 卡号 码 或 其 他 顶级 机 密 信 息 进行 加 密 是 非常 方便 的 。 
在 “使 用 pgcrypto 扩展 包 来 实现 数据 加 密 ” 这 篇 博文 (http://www.postgresonline.com/ 
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journal/archives/165-Encrypting-data-with-pgcrypto.html) 中 我 们 对 其 用 法 进行 了 快速 的 
入 门 介绍 。 


2. 经 典 扩展 包 介绍 

此 处 我 们 介绍 两 个 经 典 扩 展 包 ， 之 所 以 称 其 为 “经 典 "， 是 因为 它们 使 用 非常 广泛 并 因此 
被 PostgreSQL 官方 接纳 而 成 为 了 系统 内 核 功能 的 一 部 分 ， 但 在 老 版 本 的 PostgreSQL 上 它 
们 还 是 以 扩展 包 的 形式 存在 的 ， 你 在 实际 工作 中 有 可 能 遇 到 这 些 老 版 本 ， 所 以 我 们 在 此 还 
是 有 必要 介绍 一 下 这 些 曾 经 的 扩展 包 。 














。 tsearch (http:/www.postgresqgl.org/docs/current/interactive/textsearch-intro.html) 
该 扩展 包 封 装 了 一 系列 用 于 强化 全 文 搜 索 功 能 的 索引 、 运 算 符 、 自 定义 词典 和 函数 。 目 
前 该 扩展 包 的 功能 已 被 系统 内 核 接纳 并 成 为 PostgreSQL 基础 功能 的 一 部 分 。 如 果 你 使 
用 的 PostgreSQL 版 本 较 老 ， 在 其 上 tsearch 还 是 以 扩展 包 的 形式 存在 ， 那 么 我 们 建议 你 
可 以 升级 到 tsearch2 这 个 新 版 本 。 当 然 ， 最 好 的 做 法 其 实 是 将 PostgreSQL 服务 器 软件 
升级 到 新 版 本 ， 因 为 老 版 本 上 的 tsearch 插件 的 兼容 性 支持 随时 可 能 终止 ， 这 会 导致 你 
在 老 版 本 的 PostgreSQL 上 再 也 无 法 享受 到 相关 的 功能 更 新 和 BUG 修复 。 












































。 xml (http:/www.postgresql.org/docs/current/interactive/functions-xml.htm]l) 
该 扩展 包 提供 了 对 XML 数据 类 型 的 支持 以 及 相关 的 函数 和 运算 符 。 为 了 达到 ANSI 
SQL XML 标准 的 要 求 ，PostgreSQL 内 核 接 纳 了 该 插件 包 的 部 分 功能 。 其 余 未 被 纳入 
内 核 的 那 部 分 功能 仍 以 扩展 包 的 形式 存在 ， 不 过 已 改名 为 xml2。 具 体 来 说 ， 如 果 你 需 
要 使 用 xlst_process 函数 来 处 理 XSL 模板 数据 ， 那 么 就 需要 安装 xml2 扩展 包 。 另 外 
xml2 扩展 包 中 还 含有 一 些 XPath 函数 。 


2.7 备份 与 恢复 


PostgreSQL 自身 附带 了 两 个 备份 工具 : pg_dump 和 pg_dumpaLL， 二 者 均 位 于 bin 文件 夹 下 。 
pg_dump 可 备份 一 个 指定 的 database， 而 pg_dumpall 可 一 次 性 备份 所 有 database 的 数据 以 
及 系统 全 局 数据 。 由 于 pg_dumpall 需要 能 够 访问 系统 中 的 所 有 database， 因 此 必须 由 具备 
superuser 权限 的 角色 来 执行 。 这 两 个 工具 的 大 多 数 命令 行 选 项 都 可 以 有 两 种 写法 : 一 种 是 
GNU 风格 (两 个 横 杠 连 字 符 后 跟 一 个 单词 ) ， 另 一 种 是 传统 的 单字 母 风格 (一 个 横 杠 连 字 
符 后 跟 一 个 字母 )。 这 两 种 写法 是 完全 等 价 的 ， 其 至 在 同一 个 命令 行 中 也 可 以 混用 。 本 市 
中 我 们 仅 讨 论 一 些 基 本 的 用 法 ， 如 果 要 了 解 更 多 深入 的 内 容 ， 请 参考 PostgreSQL 官方 手册 
中 的 “备份 与 恢复 ”(http:/www.postgresql.org/docs/currentUinteractive/backup.html) 。 















































在 学 习 本 节 内 容 时 ， 你 会 发 现 我 们 一 般 会 在 示例 命令 行 中 指明 目标 数据 库 所 在 的 主机 地 址 
和 监听 端口 ， 这 是 因为 我 们 一 般 是 在 另外 一 台 机 器 上 通过 执行 定时 任务 (通过 pg_agent 实 
现 ) 的 方式 来 执行 备份 ， 这 种 情况 下 必须 在 命令 行 写 明 目 标 数据 库 的 地 址 和 侦 听 端口 ;或 
者 另外 一 种 情况 是 在 同一 台 机 器 上 运行 多 个 PostgreSQL 服务 实例 ， 实 例 间 的 侦 听 端口 互 不 
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相同 ， 所 以 命令 行 中 必须 明确 指定 IP 和 端口 。 有 一 个 情况 请 注意 : 如 果 你 的 服务 被 设置 为 
仅 监 听 LocaL， 那 么 在 备份 命令 行 中 加 上 -h (或 者 是 - -host) 选项 并 带 上 主机 IP 反而 会 引 
发 问题 ， 因 为 默认 情况 下 只 有 来 自 localhost 的 连接 才 会 被 允许 接 入 ， 指 定 卫 反而 会 导 
连接 失败 。 如 果 备 份 任务 是 直接 在 数据 库 服务 器 所 在 的 机 器 上 执行 的 ， 那 么 命令 行 中 可 以 
根本 不 用 指定 主机 地 址 ， 这 样 可 以 避免 出 问题 。 























pg_dump 和 pg_dumpall 工具 不 支持 在 命令 行 选 项 中 设 定 登 录 密 码 ， 因 此 为 了 便于 执行 自动 
任务 ， 你 需要 在 postgres 操作 系统 账号 的 home 文件 夹 下 创建 一 个 密码 文件 .pgpass 来 存储 
密码 ， 或 者 也 可 以 用 PGPASSWORD 环境 变量 来 设 定 密码 。 


2.7.1 使 用 pg_dump 进 行 有 选择 性 的 备份 

如 果 你 希望 每 天 都 进行 备份 ， 那 么 使 用 pg_dump 比 pg_dumpall 更 合适 ， 因 为 前 者 支持 精确 
指定 要 备份 的 表 、schema 和 database， 而 后 者 不 支持 。pg_dump 可 以 将 数据 备份 为 SQL 文 
本 文件 格式 ， 也 支持 备份 为 用 户 自 定义 压缩 格式 或 者 是 TAR 包 格 式 。 在 数据 恢复 时 ， 对 
压缩 格式 和 TAR 包 格 式 的 备份 文件 可 以 实现 并 行 恢 复 ， 该 特性 是 从 8.4 版 开始 支持 的 。 我 
们 认为 pg_dump 是 你 进行 日 常备 份 时 不 可 或 缺 的 工具 ， 因 此 我 们 在 本 书 附录 了 B 的 B.1 节 中 
提供 了 一 张 完整 的 pg_dump 帮助 信息 清单 ， 这 样 你 就 可 以 对 其 数量 众多 的 选项 开关 用 法 一 
目 了 然 。 













































































下 面 的 例子 展示 了 一 些 常见 的 备份 场景 以 及 相应 的 pg_dump 选项 。 这 些 例子 对 于 任何 版 本 
的 PostgreSQL 应 该 都 是 适用 的 。 


份 某 个 database， 备 份 结 果 以 自 定义 压缩 格式 输出 : 























pg_dump -h localhost -p 5432 -U someuser -F ¢ -b -v -f mydb.backup mydb 





份 某 个 database， 备 份 结果 以 SQL 文本 方式 输出 ， 输 出 结果 中 需 包 括 CREATE DATABASE 
语句 : 




















pg_dump -h localhost -p 5432 -U someuser -C -F p -b -v -f mydb.backup mydb 


份 某 个 database 中 所 有 名 称 以 “pay” 开 头 的 表 ， 备 份 结果 以 自 定义 压缩 格式 输出 : 




















pg_dump -h localhost -p 5432 -U someuser -F ¢ -b -v -t *.pay* -f pay.backup mydb 


份 某 个 database 中 hr 和 payroll 这 两 个 schema 中 的 所 有 数据 ， 备 份 结果 以 自 定义 压缩 
格式 输出 : 




















pg_dump -h localhost -p 5432 -U someuser -FC -b -v -n hr -n payroll -f hr.back- 
up mydb 


份 某 个 database 中 除了 public schema 中 的 数据 以 外 的 所 有 数据 ， 备 份 结果 以 自 定义 压 
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缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -F C -b -v -N public -f all_ sch ex 
cept_pub.backup mydb 


将 数据 备份 为 SQL 文本 文件 ， 且 生成 的 INSERT 语句 是 带 有 字段 名 列表 的 标准 格式 ， 该 文 
件 可 用 于 将 数据 导入 到 低 于 当前 版 本 的 PostgreSQL 或 者 其 他 支持 SQL 的 非 PostgreSQL 数 
据 库 中 (之 所 以 能 够 实现 这 种 数据 移植 过 程 ， 是 因为 标准 的 SQL 文本 可 在 任何 支持 SQL 
标准 的 数据 库 中 执行 ) : 























pg_dump -h LocaLhost -p 5432 -U someuser -F p --column-inserts -f se 
lect_tables.backup mydb 














如 果 输 出 文件 路 径 中 含 空格 或 者 其 他 可 能 影响 命令 行 正常 处 理 的 字符 ， 请 在 
路 径 两 侧 加 上 双 引 号 ， 比 如 : "/path with spaces/mydb.backup"。 请 注意 这 
在 PostgreSQL 中 是 一 个 通用 的 原则 ， 即 当 你 不 确定 某 段 文本 是 否 能 正常 处 
理 时 ， 都 可 以 加 双 引 号 。 














从 9.1 版 开始 支持 目录 格式 选项 。 该 选项 会 将 每 个 表 备 份 为 某 个 文件 夹 下 的 一 个 单独 的 文 
件 ， 这 样 就 解决 了 以 其 他 备份 格式 备份 时 可 能 存在 的 单个 文件 大 小 超出 操作 系统 限制 的 问 
题 。 该 选项 是 生成 多 个 文件 的 唯一 pg_dump 备份 格式 选项 ， 具 体 语法 参见 示例 2-8。 备 份 
时 会 先 创建 一 个 新 目录 ， 然 后 逐个 表 将 一 个 gzip 格式 的 压缩 文件 和 一 个 列 出 所 有 包含 结 
构 的 文件 填充 到 该 目录 中 。 如 果 备 份 开 始 时 发 现 指定 的 目录 已 存在 ， 那 么 该 命令 会 报错 并 
退出 。 


示例 2-8: 目录 格式 备份 


pg_dump -h LocaLhost -p 5432 -U someuser -F d -f /somepath/a_directory mydb 























从 9.3 版 开始 支持 并 行 备份 选项 - -jobs (-j)。 如 果 将 其 设 定 为 --jobs=3， 则 后 台 会 有 三 
个 线程 并 行 执行 当前 备份 任务 。 此 选项 只 有 在 按 目 孙 格 式 进行 备份 时 才 会 生效 ， 每 个 写 线 
程 只 负责 写 一 个 单独 的 文件 ， 因 此 一 定 是 输出 结果 为 多 个 独立 的 文件 时 才 可 以 并 行 。 示 例 
2-9 演示 了 其 用 法 。 

示例 2-9: 目录 格式 并 行 备份 


pg_dump -h localhost -p 5432 -U someuser -j 3 -Fd -f /somepath/a_directory mydb 

















2.7.2 ”使 用 pg_dumpall 进 行 全 库 备份 


pg_dumpall 工具 可 以 将 当前 PostgreSQL 服务 实例 中 所 有 database 的 数据 都 导出 为 SQL 文 
本 (请 注意 : pg_dumpall 不 支持 导出 SQL 文本 以 外 的 其 他 格式 )， 也 可 以 同时 导出 表 空间 
定义 和 角色 等 全 局 对 象 。 要 了 解 该 命令 支持 的 所 有 选项 ， 请 参考 本 书 附 录 B 的 B.2 市 的 











42 | 第 2 章 


我 们 建议 你 每 天 都 对 角色 和 表 空 间 定义 等 全 局 对 象 进行 备份 ， 但 不 建议 每 天 都 使 用 pg_ 
dumpall 来 备份 全 库 数 据 ， 因 为 pg_dumpall 仅 支 持 导 出 为 SQL 文本 格式 ， 而 使 用 这 种 庞大 
的 SQL 文本 备份 来 进行 全 库 级 别 的 数据 恢复 是 极其 耗 时 的 ， 所 以 一 般 只 建议 用 pg_dumpall 
来 备份 全 局 对 象 而 非 全 库 数据 ， 如 果 你 一 定 要 用 pg_dumpall 来 备份 全 库 数据 的 话 ， 一 般 一 
个 月 执行 一 次 就 够 了 。 


以 下 命令 可 实现 仅 备份 角色 和 表 空 间 定义 : 



































pg_dumpall -h localhost -U postgres --port=5432 -f myglobals.sgqgl --globals-only 


如 果 仅 需 备份 角色 定义 而 无 需 备 份 表 空间 ， 那 么 可 以 加 上 --roles-only 选项 : 


pg_dumpall -h localhost -U postgres --port=5432 -f myroles.sgql --roles-only 


2.7.3 ”数据 恢复 


PostgreSQL 支持 以 下 两 种 数据 恢复 方法 : 


。 使 用 psql 来 恢复 pg_dump 或 者 pg_dumpall 工具 生成 的 SQL 文本 格式 的 数据 备份 ; 
。 使 用 pg_restore 工具 来 恢复 由 pg_dump 工具 生成 的 自 定义 压缩 格式 、TAR 包 格 式 或 者 
目录 格式 备份 。 


1. 使 用 psqt 恢 复 SQL 文 本 格式 的 数据 备份 

所 谓 的 SQL 文本 格式 的 数据 备份 其 实 就 是 一 个 包含 SQL 脚本 的 文本 文件 。 这 种 备份 格式 
使 用 起 来 最 不 方便 ， 但 却 是 最 通用 的 一 种 格式 。 恢 复 时 需要 将 此 SQL 脚本 全 部 执行 一 遍 。 
你 无 法 选择 性 地 仅 恢复 部 分 数据 ， 除 非 你 手工 编辑 此 文件 。 以 下 示例 都 是 在 操作 系统 命令 
行 界面 执行 ， 过 程 中 可 能 需要 在 psql 界面 上 输入 密码 。 
















































































恢复 一 个 SQL 备份 文件 并 忽略 过 程 中 可 能 发 生 的 所 有 错误 : 




















psql -U postgres -f myglobals.sgl 


恢复 一 个 SQL 备份 文件 ， 如 遇 任 何 错误 则 立即 停止 恢复 : 

















psql -U postgres --set ON_ERROR_STOP=on -f myglobals.sgl 
将 SQL 文本 中 的 数据 恢复 到 某 个 指定 的 database: 
psql -U postgres -d mydb -f select objects.sgl 


2. 使 用 pg_restore 进 行 恢复 

如 果 你 是 使 用 pg_dump 进行 的 备份 ， 并 且 选 择 的 输出 格式 为 tar (TAR 包 格 式 ) 或 者 
custom ( 自 定义 压缩 格式 ) 或 者 directory (目录 格式 ， 为 每 张 表 生成 一 个 文件 ， 输 出 到 指 
定 路 径 中 )， 那 么 你 可 以 使 用 功能 强大 的 pg_restore 工具 来 进行 恢复 。pg_restore 支持 的 
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选项 之 多 令 人 眼花 练 乱 ， 远 远 超 过 我 们 所 使 用 过 的 其 他 任何 数据 库 中 提供 的 恢复 工具 。 以 
下 介绍 一 些 该 工具 的 特别 功能 





。 支持 并 行 恢复 ， 使 用 -j 选项 可 以 控制 并 行 恢复 的 线程 数 。 多 个 恢复 线程 可 以 并 行 处 理 
每 个 线程 处 理 一 张 表 。 该 模式 可 以 显著 提高 恢复 速度 。 

。 你 可 以 使 用 pg_restore 扫描 备份 文件 来 生成 一 张 备份 内 容 列 表 ， 通 过 该 列表 可 以 确认 
备份 中 包含 了 哪些 内 容 。 你 还 可 以 通过 编辑 该 内 容 列表 来 控制 恢复 哪些 内 容 。 

。 pg_dump 支持 选择 性 地 仅 备 份 部 分 对 象 以 节省 备份 时 间 ， 类 似 地 ，pg_restore 也 支持 选 
择 性 地 仅 恢 复 部 分 对 象 ,不管 备 份 文件 本 身 是 全 库 备 份 还 是 部 分 对 象 的 备份 都 没有 问题 。 

。 pg_restore 的 大 部 分 功能 是 后 向 兼容 的 ， 即 支持 将 老 版 本 PostgreSQL 生成 的 备份 数据 
恢复 到 新 版 本 的 PostgreSQL 中 。 


如 想 了 解 pg_restore 命令 所 支持 的 全 部 选项 ， 请 参考 附录 B 中 B.3 市 的 内 容 。 
在 使 用 pg_restore 执行 恢复 动作 之 前 ， 请 先 创建 目标 数据 库 : 














CREATE DATABASE mydb; 
然后 执行 恢复 : 


pg_restore --dbname=mydb --jobs=4 --verbose mydb.backup 

















如 果 备 份 和 恢复 时 使 用 的 database 同名 ， 则 可 以 通过 加 --create 选项 省 去 单独 建 库 的 过 
程 ， 命 令 如 下 : 


pg_restore --dbname=postgres --create --jobs=4 --verbose mydb.backup 


如 果 指 定 了 --create 选项 ， 那 么 恢复 出 来 的 数据 库 名 就 会 默认 采用 备份 时 的 
数据 库 名 ， 不 允许 改名 。 如 果 还 同时 指定 了 --dbname 选项 ， 那 么 此 时 连接 的 
数据 库 名 一 定 不 能 是 待 恢复 的 数据 库 名 ， 因 为 要 恢复 数据 库 之 前 必然 要 建 数 
据 库 ， 而 要 建 数据 库 之 前 必然 要 先 连 到 某 个 已 存在 的 数据 库 ，- -dbname 选项 
指定 的 就 是 建立 被 恢复 的 数据 库 之 前 先 连 到 哪个 数据 库 ， 所 以 必然 不 能 与 待 
恢复 的 数据 库 重 名 ， 我 们 一 般 指 定 为 先 连 到 postgres 数据 库 。 





























9.2 版 或 更 新 版 本 的 pg_restore 支持 --section 选项 ， 加 上 该 选项 后 可 以 实现 仅 恢复 表 结 
构 而 不 恢复 表 数 据 。 当 我 们 希望 创建 模板 数据 库 时 可 以 用 这 个 方法 ， 因 为 模板 数据 库 一 般 
不 需要 带 数据 。 有 具体 做 法 是 先 创建 恢复 目标 数据 库 : 











CREATE DATABASE mydb2; 


然后 使 用 pg_restore: 


pg_restore --dbname=mydb2 --section=pre-data --jobs=4 mydb.backup 
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2.8 基于 表 空 间 机 制 进行 存储 管理 


PostgreSQL 使 用 “ 表 空 间 ” 这 一 概念 来 将 逻辑 存储 空间 映射 到 磁盘 上 的 物理 存储 空间 。 
PostgreSQL 在 安装 阶段 会 自动 生成 两 个 表 空 间 : 一 个 是 pg_default， 用 于 存储 所 有 的 用 户 
级 数据 ， 另 一 个 是 pg_global， 用 于 存储 所 有 的 系统 级 数据 。 这 两 个 表 空 间 就 位 于 默认 的 
数据 文件 夹 下 。 你 可 以 不 受 限 地 创建 表 空 间 并 将 其 物理 存储 位 置 设 定 到 任何 一 块 物理 磁盘 
上 。 你 也 可 以 为 database 设 定 默 认 表 空间 ， 这 样 该 database 中 创建 的 任何 新 对 象 都 会 存储 
到 此 表 空 间 上 。 你 也 可 以 将 现存 的 数据 库 对 象 迁 移 到 新 的 表 空 间 中 。 


2.8.1 表 空 间 的 创建 

创建 表 空 间 需 要 先 为 其 取 一 个 逻辑 名 称 并 指定 某 个 物理 文件 夹 作 为 其 存储 位 置 ， 注 意 要 确 
保 postgres 操作 系统 账户 对 此 文件 夹 有 完全 的 访问 权限 。 如 果 你 目前 使 用 的 是 Windows 
服务 器 ， 请 使 用 如 下 命令 行 (注意 使 用 Unix 风格 的 斜 杠 作为 路 径 分 隔 符 ) : 


















































CREATE TABLESPACE secondary LOCATION 'C:/pgdata94 secondary'; 





对 于 基于 Unix 的 系统 来 说 ， 你 必须 先 创建 文件 夹 或 者 定义 一 个 fstab 位 置 ， 然 后 执行 以 下 
命令 : 


CREATE TABLESPACE secondary LOCATION '/usr/data/pgdata94 secondary'; 
ml Mg ,4 
2.8.2 ”在 表 空间 之 间 迁 移 对 象 


你 可 以 将 数据 库 中 的 对 象 在 表 空间 之 间 随 意 迁移 。 如 果 希 望 将 一 个 database 的 所 有 对 象 都 
移动 到 另 一 个 表 空间 中 ， 可 以 执行 以 下 命令 : 








ALTER DATABASE mydb SET TABLESPACE secondary; 


如 果 只 希望 移动 一 张 表 ,命令 如 下 : 





ALTER TABLE mytable SET TABLESPACE secondary; 


PostgreSQL 9.4 版 中 引入 了 一 个 新 功能 : 一 次 性 把 一 个 表 空间 的 多 个 对 象 迁移 到 另 一 个 表 
空间 。 如 果 命 令 执 行者 是 超级 用 户 ， 那 么 源 表 空 间 所 有 的 对 象 都 会 被 迁移 过 去 ， 否 则 仅 会 
迁移 执行 者 所 拥有 的 对 象 。 


将 pg_default 默认 表 空 间 中 的 所 有 对 象 迁 移 到 secondary 表 空 间 ， 所 需 的 命令 行 如 下 : 





ALTER TABLESPACE pg_default MOVE ALL TO secondary; 





在 迁移 过 程 中 所 涉及 的 database 和 表 会 被 锁定 。 
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2.9 禁止 的 行为 

我 们 发 现 人 们 总 是 会 犯 各 种 各 样 、 花 式 翻 新 的 错误 来 将 PostgreSQL 系统 搞 骨 让， 因此 在 本 
章 的 最 后 一 节 中 ， 我 们 认为 有 必要 逐条 列 出 那些 最 常见 的 错误 。 对 于 初学 者 来 说 ， 如 果 你 
搞 不 请 到 底 哪里 出 了 问题 ， 那 么 请 首先 查看 系统 日 志 ， 从 中 可 以 找到 解决 问题 的 线索 。 日 
志文 件 位 于 数据 文件 夹 的 根 目 录 或 者 其 中 的 pg_log 子 文件 夹 下 。 也 有 可 能 系统 在 记 下 日 志 
之 前 即 已 崩溃 ， 那 么 显然 这 种 情况 下 查 日 志 是 疫 用 的 。 如 果 你 的 PostgreSQL 服务 启动 失 
败 ， 请 尝试 执行 以 下 操作 系统 命令 。 





























path/to/your/bin/pg_ctl -D your_postgresgl_data folder 


2.9.1 切记 不 要 删除 PostgreSQL 系 统 文件 

你 可 能 觉得 这 是 废话 ， 但 当 磁 盘 空 间 不 够 的 时 候 有 些 人 就 会 慌 手 慌 脚 地 从 PostgreSQL 的 数 
据 文件 夹 下 删除 文件 ， 因 为 它 占用 的 空间 实在 是 太 大 了 。 出 现 这 种 问题 的 部 分 原因 是 有 些 
文件 夹 的 名 称 的 确 很 容易 令 人 误解 ， 比 如 : pg_log、pg_xlog 和 pg_clog。 这 些 名 称 看 起 来 
就 像 是 用 于 存放 日 志 的 文件 夹 ， 所 以 可 以 “安心 地 ”删除 。 这 种 做 法 是 危险 的 ， 因 为 有 些 
文件 删 了 没事 ， 有 些 删 了 就 会 导致 数据 库 被 破坏 。 


pg_log 文件 夹 一 般 会 在 data 文件 夹 下 ， 其 体积 可 能 增长 得 很 快 ， 尤 其 是 当 打 开 了 日 志 开 关 
的 时 候 。 这 个 文件 夹 下 的 文件 任何 时 候 都 可 以 安全 删除 ， 事 实 上 很 多 人 会 设置 一 个 定时 任 
务 来 定期 清空 这 些 日 志文 件 。 


除了 pg_xlog 文件 夹 下 的 文件 可 以 有 条 件 地 删除 外 ， 其 他 PostgreSQL 系统 文件 夹 中 的 文件 
都 不 能 删 ， 即 使 有 的 文件 夹 名 称 中 带 有 log 字样 因而 看 起 来 像 是 某 种 日 志 ， 也 绝对 不 能 删 ， 
比如 pg_clog 文件 夹 中 存储 的 是 活跃 事务 提交 日 志 , 千 万 不 要 碰 。 


pg_xlog 文件 夹 用 于 存储 事务 日 志 。 我 们 见 过 有 的 系统 中 会 在 pg_xlog 文件 夹 下 建 一 个 子 
文件 夹 archive， 专 门 用 于 存放 归档 的 事务 日 志 。 一 般 来 说 你 的 系统 总 会 需要 建 一 个 专门 的 
文件 夹 ( 该 文件 夹 不 一 定 要 放 在 pg_xlog 下 ) 用 于 日 志 归 档 ， 因 为 如 果 这 是 一 个 同步 复制 
环境 ， 那 么 需要 持续 地 进行 事务 日 志 归 档 ， 需 要 归档 文件 夹 的 另 一 个 理由 是 得 把 这 些 日 志 
存 下 来 以 备 不 时 之 需 ， 因 为 我 们 有 可 能 需要 将 系统 数据 恢复 到 过 去 的 某 个 时 间 点 。 将 pg_ 
xlog 文件 夹 下 的 所 有 文件 都 删除 会 导致 系统 数据 被 严重 破坏 ， 比 如 引发 数据 不 一 致 或 丢 
失 等 。 但 仅 删 除 归档 文件 夹 下 的 日 志 却 没 这 么 严重 ， 最 多 会 导致 无 法 恢复 到 过 去 的 某 个 时 
点 ， 或 者 是 在 同步 环境 下 可 能 导致 从 属 服务 器 无 法 进行 数据 同步 ， 因 为 还 未 来 得 及 同步 的 
一 些 日 志文 件 可 能 已 被 删 摊 了 。 如 果 以 上 场景 在 你 的 系统 中 都 不 涉及 ， 那 么 可 以 放心 地 删 
除 归 档 文 件 夹 下 的 日 志文 件 。 


要 当心 某 些 过 于 “尽责 ”的 杀毒 软件 ， 特 别 是 在 Windows 上 。 我 们 曾经 遇 到 过 杀毒 
软件 把 很 重要 的 PostgreSQL 可 执行 文件 给 删 掉 的 和 案例。 如果 在 Windows 环境 下 发 现 
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PostgreSQL 无 法 启动 ， 记 得 首先 查看 一 下 事件 查看 器 (event viewer) 的 记录 ， 其 中 可 能 
存在 有 用 的 线索 。 








2.9.2 ”不 要 把 操作 系统 管理 员 权 限 授予 PostgreSQL 的 系统 
账号 (postgres) 

很 多 人 可 能 会 误 认 为 postgres 这 个 操作 系统 账号 必须 拥有 操作 系统 的 管理 员 权 限 。 事 实 
上 ,在 有 的 PostgreSQL 版 本 上 ， 如 果 给 予 了 postgres 账号 管理 员 权 限 ， 很 有 可 能 导致 
该 机 器 操作 系统 启动 失败 。postgres 账号 的 身份 应 该 就 是 一 个 普通 用 户 账号 ， 甚 权限 只 
要 能 够 访问 data 文件 夹 以 及 其 他 表 空 间 文件 夹 即 可 。 大 多 数 PostgreSQL 安装 包 会 自动 为 
postgres 账号 设 定 够 用 的 权限 ， 请 不 要 再 画蛇添足 。 在 SQL 注入 攻击 中 ， 那 些 不 必要 的 
权限 会 为 攻击 者 们 提供 可 乘 之 机 。 


有 些 情况 下 ， 的 确 是 有 必要 把 data 文件 夹 以 外 的 某 些 文件 夹 或 者 可 执行 程序 的 “改写 / 删 
除 / 读 取 ” 权 限 授予 postgres 帐号。 比如， 当 需 要 设置 一 个 定时 任务 来 执行 批 处 理 任 务 时 
就 需要 这 么 干 。 针 对 这 种 情况 ， 我 们 也 建议 你 仅仅 授予 postgres 账号 最 小 的 必要 权限 ， 而 
不 应 该 为 了 图 省 事 而 直接 授予 其 最 高 权限 。 

























































































2.9.3 不 要 把 shared_buffers 缓 存 区 设置 得 过 大 

禁止 将 shared_buffers 设置 得 和 系统 当前 内 存 总 容量 一 样 大 ， 这 么 做 很 可 能 会 导致 操作 系 
统 崩 误 或 者 是 启动 失败 。 在 32 位 Windows 系统 上 ， 该 设置 如 果 超 过 512 MB 就 可 能 导致 
系统 出 问题 。 在 64 位 Windows 上 ， 该 限制 可 以 放宽 到 1 GB 或 者 更 多 一 些 也 没 问 题 。 在 
有 些 Linux 系统 上 ， 不 能 将 shared_buffers 设置 得 大 于 编译 过 的 SHMMAX 变量 ， 而 一 般 来 说 
SHMMAX 的 值 是 比较 小 的 ， 所 以 这 就 给 shared_buffers 的 设置 带 来 了 一 些 限制 。PostgreSQL 
9.3 版 修改 了 内 核对 于 内 存 的 使 用 方法 ， 因 此 之 前 版 本 中 那些 因 内 核 限制 而 导致 的 问题 
从 该 版 本 开始 不 复 存在 。 官 方 手册 中 “内 核资 源 管理 ”(http://www.postgresql.org/docs/ 
current/interactive/kernel-resources.html) 这 一 市 介绍 了 更 多 关于 这 方面 的 细节 。 














2.9.4 不 要 将 PostgreSQL 服 务 器 的 侦 听 端口 设 为 一 个 已 被 
其 他 程序 占用 的 端口 

如 果 启 动 PostgreSQL 时 系统 发 现 侦 听 端口 已 被 占用 ， 那 么 会 在 pg_log 中 记录 类 似 这 样 的 

错误 上 日志: make sure PostgreSQL is not already running。 以 下 是 可 能 导致 该 问题 的 常见 

原因 。 


。 postgres 服务 实例 已 经 启动 好 了 ， 而 你 正 试图 再 启动 一 遍 。 
。 PostgreSQL 服务 侦 听 端口 已 被 其 他 程序 占用 。 











数据 库 管 理 | 47 








。 postgres 服务 之 前 发 生 过 异常 关闭 或 者 崩溃 ， 在 data 文件 夹 下 遗留 了 一 个 postgresql.pid 
文件 。 请 直接 删除 该 文件 并 再 次 尝试 启动 。 

。 有 一 个 孤立 的 PostgreSQL 进程 还 在 运行 。 如 果 前 述 方法 都 试 过 了 但 问题 仍 未 解决 ， 请 
终止 所 有 还 在 运行 的 PostgreSQL 进程 然后 再 次 尝试 启动 。 








第 3 章 


psql 工 具 





psql 是 PostgreSQL 自 带 的 一 个 不 可 或 缺 的 命令 行 执行 工具 ， 其 用 途 多 种 多 样 ， 除 了 执 
行 SQL 这 个 基本 功能 外 ， 还 可 用 于 自动 化 执行 脚本 、 导 入 导出 数据 、 恢 复 表 数 据 以 及 
执行 数据 库 管理 任务 ， 它 其 至 还 可 以 作为 一 个 简单 的 报表 生成 器 来 使 用 。 如 同 其 他 命令 
行 工 具 一 样 ，psql 使 用 时 也 需要 了 解 各 种 各 样 的 选项 。 如 果 你 无 法 以 图 形 界面 工具 访问 
PostgreSQL， 那 么 psql 可 能 是 你 执行 SQL 语句 以 及 进行 数据 库 管理 任务 的 唯一 选择 。 在 
学 习 本 章 时 ， 我 们 建议 你 将 本 书 附录 B 中 B.4 市 的 psql 转 储 的 帮助 信息 打印 出 来 ， 放 在 手 
边 以 备查 阅 。 


















































3.1 “环境 变量 


在 设置 了 PGHOST、PGPORT 和 PGUSER 等 环境 变量 后 ， 在 调用 psql 命令 行 时 就 可 以 不 用 显 式 
地 指定 主机 、 端 口 和 用 户 ， 系 统 会 自动 使 用 环境 变量 设 定 的 值 ， 这 一 点 跟 PostgreSQL 自 
带 的 其 他 命令 行 工具 是 一 样 的 。 关 于 环境 变量 的 使 用 细节 ， 请 参考 官方 手册 中 “环境 变 
”这 一 节 的 介绍 (http://www.postgresql.org/docs/current/interactive/libpq-envars.html)。 你 
也 可 以 用 PGPASSWORD 这 个 环境 变量 来 设置 登录 密码 ， 或 者 是 通过 密码 文件 来 设置 也 可 以 。 
有 关 密 码 文件 的 详细 信息 ， 请 参见 官方 手册 中 “密码 文件 ”这 一 节 的 介绍 (http://www. 
postgresql.org/docs/currentinteractive/libpq-pgpass.html) 。 从 PostgreSQL 9.2 版 开始 ，psql 开 
始 支 持 以 下 两 个 新 的 环境 变量 。 














上 





。 PSQL_HISTORY 
该 变量 用 于 设置 psql 历史 日 志文 件 名 ， 该 日 志 中 记录 了 近期 通过 psql 执行 过 的 所 有 命 
令 行 ， 其 默认 值 为 ~/.psql_history。 
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。 PSQLRC 
该 变量 用 于 设置 配置 文件 的 路 径 和 文件 名 。 


如 果 你 既 未 设 定 相 应 的 环境 变量 也 未 在 命令 行 中 指定 相关 形 参 ， 那 么 psql 会 使 用 系统 默认 
值 。 在 本 章 示例 中 ， 我 们 假定 你 使 用 默认 值 或 已 设置 这 些 变量 。 如 果 你 使 用 pgAdmin 工 
具 ， 那 么 也 可 以 通过 其 工具 栏 上 的 “插件 ”菜单 项 来 直接 打开 psql ( 详 见 4.2.1 节 的 内 容 )， 
点 击 后 会 打开 一 个 已 经 连接 到 相应 database 的 psql 窗口 。 


3.2 psql 的 两 种 操作 模式 : 交互 模式 与 非 交 互 
模式 


直接 在 操作 系统 的 命令 行 界面 上 键入 psql 并 回 车 ， 从 操作 系统 提示 符 切换 到 psql 提示 符 
后 就 表示 已 经 进入 了 psql 的 交互 模式 界面 。 你 现在 就 可 以 执行 命令 了 ， 记 得 要 输入 分 号 作 
为 命令 结束 标记 ， 要 是 不 输 就 直接 回 车 的 话 ，psql 会 认为 命令 还 未 输入 完成 ， 会 在 换行 后 
等 待 继 纪 卖 输 入 。 


在 psql 界面 上 键入 \? 会 列 出 交互 模式 下 支持 的 所 有 命令 。 为 了 方便 读者 ， 我 们 将 这 些 命 
令 列表 放 在 本 书 附录 B 中 ， 并 对 一 些 最 新 版 本 中 添加 的 条 目 以 高 亮 标 记 ， 有 具体 请 参见 本 
书 附 录 B 中 的 B.4 节 。 如 果 在 psql 界面 上 键入 \h 后 跟 命令 关键 字 ， 则 会 打印 出 该 命令 在 
PostgreSQL 官方 手册 中 相应 的 语法 帮助 信息 。 



















































































要 在 非 交互 模式 下 使 用 psql， 请 从 OS 命令 提示 符 执行 psqL， 并 给 其 传送 一 个 脚本 文件 。 
psql 的 “ 非 交互 模式 ”是 指 在 调用 psql 时 直接 以 选项 的 形式 指定 要 执行 的 脚本 ， 脚 本 中 可 
以 含有 任意 数量 的 SQL 和 psql 语句， 然后 psql 会 自动 执行 此 脚本 的 内 容 ， 期 间 无 需 与 用 
户 进行 交互 ， 这 就 是 “ 非 交互 模式 ”的 本 意 。 除 执行 脚本 外 ， 非 交互 模式 还 支持 直接 执行 
一 条 或 多 条 SQL 语句 ， 不 过 语句 两 侧 需 要 加 上 双 引 号 。 可 以 看 出 该 模式 特别 适用 于 需要 执 
行 自动 化 任务 的 场景 。 只 需要 将 任务 内 容 写 和 人 脚本 文件 ， 然 后 用 某 种 定时 任务 工具 来 设置 
好 定时 执行 即 可 。 定 时 任务 工具 可 以 采用 pgAgent (其 用 法 在 4.5 节 中 有 详细 介绍 ) ， 或 者 
在 Linux/Unix 下 可 以 使 用 crontab， 在 Windows 下 可 以 使 用 定时 任务 规划 器 。 如 果 某 个 任 
务 包含 很 多 操作 ， 并 且 操 作 必 须 按 顺序 执行 或 者 反复 执行 ， 那 么 最 好 是 写成 脚本 并 用 psql 
定时 执行 。 由 于 非 交 互 模式 下 绝 大 多 数 操作 逻辑 都 由 脚本 实现 ， 因 此 命令 行 需要 提供 的 选 
项 很 有 限 。 要 在 非 交互 模式 下 执行 脚本 文件 ， 只 需 使 用 -f 选项 即 可 : 






































psqL -f some script File 


要 在 非 交 互 模式 下 执行 SQL 语句 ， 只 需 使 用 -c 选项 即 可 ， 如 果 要 一 次 执行 多 个 语句 ， 语 
句 之 间 请 用 分 号 分 隔 : 





psql -d postgresql_book -c "DROP TABLE IF EXISTS dross; CREATE SCHEMA staging;”" 











如 需 了 解 非 交 互 模式 下 所 支持 的 全 部 选项 ， 请 参见 本 书 附录 B 中 B.5 市 的 介绍 。 
请 注意 : 在 脚本 中 可 以 使 用 交互 命令 。 


示例 3-1: 带 交 互 式 命令 的 脚本 
\a \t 
SELECT "CREATE TABLE 
staging.count to_50 (array_to_string(array_agg('x' || i::text ' varchar(10)));' As 
create_sqlL @ 
FROM generate_series(1,9) As i; 
\g create script.sqlL ©@ 
\i create script.sql @ 


假设 你 创建 了 示例 3-1 中 的 脚本 build_stage.psql。 


@ 我 们 希望 该 脚本 执行 后 输出 的 结果 是 能 直接 运行 的 SQL 语句 ， 因 此 需要 用 \t 来 忽略 
标题 栏 的 输出 ， 同 时 使 用 \a 关闭 对 齐 模式 以 防止 psql 为 对 齐 输出 结果 而 自动 加 上 换 
行 符 。 

@ 生成 带 9 个 varchar 列 的 表 。 

@ 使 用 \g 让 所 有 查询 内 容 都 输出 到 指定 文件 。 

@ 使 用 \i 来 执行 指定 的 脚本 文件 。\i 的 效果 等 同 于 非 交 互 模式 下 的 -f 选项 。 


要 执行 上 述 的 示例 3-1， 在 操作 系统 命令 行 界面 下 输入 以 下 命令 行 即 可 。 

















psql -f build_stage.psql -d postgresqL_book 




















示例 3-1 中 借鉴 了 “如 何 创建 一 个 有 NN 个 列 的 表 ” 这 篇 博文 (http://www.postgresonline. 
com/journal/archives/230-How-to-create-an-n-column-table-really-fast.html) 中 所 介绍 的 方法 
来 建 表 。 这 篇 文章 中 介绍 的 方法 无 需 借助 中 间 文 件 ， 而 是 采用 了 从 PostgreSQL 9.0 版 开始 
支持 的 D0 命令 来 执行 自动 化 建 表 。 


3.3 ”定制 psql 操 作 环 境 


如 果 你 的 工作 需要 整 天 与 psql 打交道 ， 那 么 可 以 对 psql 操作 环境 进行 定制 以 使 其 更 好 地 符 
合 自己 的 使 用 习惯 。psql 在 启动 阶段 会 搜索 一 个 名 为 psqlrc 的 配置 文件 ， 如 果 找 到 则 会 顺 
序 执行 其 中 的 配置 动作 ， 这 些 配置 决定 了 psql 的 一 些 行为 模式 。 


























在 Linux/Unix 环境 中 ， 该 文件 一 般 会 被 命名 为 .psqlrc 并 放置 在 postgres 用 户 的 home 目录 
下 。 在 Windows 上 ， 该 文件 叫 作 psqlrc.conf 并 被 放置 于 %APPDATA%\postgresql 文件 夹 
下 ， 一 般 来 说 就 是 c:\Users\username\AppData\Roaming\postgresql 文件 夹 。PostgreSQL 安 
装 完成 后 找 不 到 此 文件 是 正常 的 ， 因 为 该 文件 一 般 需 手动 创建 。 该 文件 中 的 设置 项 会 覆盖 
psql 的 默认 值 。 如 需 了 解 更 多 关于 此 配置 文件 的 信息 ， 请 参见 官方 手册 中 “psql 参考 手册 ” 
(http://www.postgresql.org/docs/current/interactive/app-psql.html) 这 一 节 的 内 容 。 
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示例 3-2 中 展示 了 psqlrc 文件 的 内 容 ， 你 可 以 在 其 中 添加 任何 psqt 命令 以 在 启动 时 执行 。 


示例 3-2: sqlrc 文件 内 容 
\pset nuLL 'NULL' 
\encoding Latin1 
\set PROMPT1 '%nNn@%M:%>%x %/# “ 
\pset pager always 


\timing on 
\set qstats92 'SELECT usename, datname, left(query,100) || ''...'' As query 
FROM pg_stat _activity WHERE state != ''idle'' 和 


psqlrc 文件 中 set 命令 后 跟 的 操作 内 容 不 允许 分 为 多 行书 写 。 例 如 ， 上 面 的 
qstats92 后 跟着 的 SQL 语句 必须 落 在 同一 行 中 。 上 文 显示 为 两 行 仅仅 是 因 
为 该 语句 较 长 导致 印刷 时 放 不 下 ， 所 以 必须 分 成 两 行 。 





启动 psql 时 ， 你 可 以 看 到 该 文件 中 内 容 被 执行 后 的 输出 结果 。 


Null display is "NULL". 

Timing ts on. 

Pager is always used. 

psql (9.3.2) 

Type "help" for help. 
postgres@localhost:5442 postgresq 


lL_book# 


有 的 psql 设置 命令 仅 适 用 于 Linux/Unix 环境 而 不 适用 于 Windows 环境 ， 反 之 亦 然 。 但 不 
管 在 什么 操作 系统 环境 下 ， 在 指定 路 径 时 都 应 使 用 Linux/Unix 风格 的 正 斜 杜 〈/) ， 其 目的 











是 为 了 区 别 于 指定 选项 时 所 用 的 反 斜 相 
一 步 又 ,请 加 -X 选项 。 





[ (\)。 如 果 和 希望 psql 启动 时 跳 过 加 载 psqlrc 文件 这 


如 果 要 删除 某 个 psql 配置 变量 或 者 希望 将 其 设置 回 默 认 值 ， 可 以 使 用 \unset 命令 ， 后 跟 


变量 名 称 ， 比 如 : \unset qstat92。 


下 文中 我 们 将 介绍 一 些 最 常用 的 psql 

















忆 置 项 。 请 注意 这些 配置 项 并 不 一 定 要 放 入 psqlrc 


文件 中 进行 管理 ， 它 们 可 以 随时 按 需 动态 修改 。 以 下 两 篇 博文 中 介绍 了 更 多 关于 psqlrc 文 





件 的 用 法 ， 可 供 你 参考 :“DBA 的 便捷 工具 


com.br2011/11/psqlrc-file-for-dbas.html) 








psqlrc 配置 文件 ”(http://raghavt.blogspot. 
和 “消除 .psqlre 文件 的 执行 反馈 信息 ”(http:/ 


www.depesz.com/2008/05/18/silencing-commands-in-psqlrc/) 。 


3.3.1 自 定义 psql 界 面 提 


示 符 


如 果 你 工作 时 需要 使 用 psql 连 到 多 台 不 同 的 数据 库 服务 器 或 者 多 个 不 同 的 database， 那 么 
一 定 会 经 常用 到 \connect 命令 。 在 默认 情况 下 ， 连 到 不 同 数 据 库 以 后 的 命令 提示 符 都 是 一 


样 的 ， 这 很 可 能 会 导致 误 操 作 的 发 生 。 








定制 后 的 psql 界面 提示 符 可 以 告诉 你 当前 连接 的 是 

















哪 台 服务 器 上 的 哪个 database， 从 而 避免 误 操 作 的 发 生 。 在 前 文 提 供 的 示例 psqlrc 文件 中 ， 
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我 们 把 提示 符 设 成 了 这 样 : 
\set PROMPT1 '%n@%M:%>%x %/# 


其 中 包括 了 几 个 元 素 : 登录 角色 (%n)， 主 机 名 (%M)， 侦 昕 端口 (%>)， 事 务 状态 (%x) 以 
及 当前 使 用 的 database 名 〈%/)。 这 种 写法 可 能 有 点 详细 得 过 了 头 ， 你 可 以 按 需 裁剪 一 下 。 
提示 符 所 支持 的 完整 符号 列表 可 从 官方 手册 的 “psql 参考 手册 ” (http://www.postgresql.org/ 


docs/current/interactive/app-psql.html) 这 一 节 中 找到 。 


连接 到 数据 库 后 ， 提 示 符 看 起 来 会 像 下 面 这 样 。 














postgres@localhost:5442 postgresql_book# 
执行 \connect postgis_book 切换 目标 数据 库 后 ， 提 示 符 会 变 成 下 面 这 样 。 


postgres@localhost:5442 postgis_book# 


3.3.2 ”语句 执行 时 间 统 计 
有 时候 我 们 可 能 会 需要 psql 打印 出 执行 每 个 语句 所 消耗 的 上 时间。 通过 \timing 命令 来 打开 
或 者 关闭 执行 时 间 统 计 开 关 。 








打开 执行 时 间 统 计 开 关 时 ， 每 个 查询 执行 完毕 的 输出 结果 中 都 会 附带 执行 时 长 。 例 如 : 使 
用 \timing on 命令 执行 SELECT COUNT(*) FROM pg_tables 后 ， 输 出 如 下 : 











(1 row) 
Time: 18.650 ms 


3.3.3 ”事务 自动 提交 

默认 情况 下 ，AUTOCOMMIT (自动 提交 ) 是 开 着 的 ， 也 就 是 说 任何 一 个 SQL 语句 执行 完毕 后 ， 
它 所 做 的 数据 修改 都 会 被 立即 提交 ， 这 种 情况 下 每 个 语句 都 是 一 个 独立 的 事务 ， 一旦 执行 完 
毕 后 其 结果 就 不 可 撤销 。 如 果 你 需要 运行 大 量 的 DML 语句 并 且 这 些 语句 还 未 经 充分 测试 ， 
那么 自动 提交 功能 会 带 来 大 麻烦 ， 此 时 有 必要 关闭 事务 自动 提交 机 制 来 对 数据 进行 保护 。 


























请 先 关闭 自动 提交 功能 : \set AUTOCOMMIT off; 然后 就 可 以 按 需 对 事务 进行 回 滚 了 : 
UPDATE census.facts SET short_name = 'This is a mistake.'; 


要 回 滚 事务 ， 请 执行 : 


ROLLBACK ; 
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要 提交 事务 ， 请 执行 : 


COMMIT; 








在 非 自动 提交 模式 下 请 一 定 要 记得 在 最 后 提交 事务 ， 否 则 未 提交 的 事务 会 在 



































退出 psql 时 自动 回 滚 掉 。 





3.3.4 ”命令 别名 

你 可 以 使 用 \set 来 为 某 个 命令 创建 别名 ， 我们 建议 你 将 全 局 性 的 别名 写 到 psqlrc 文件 中 
去 。 例 如 ， 如 果 你 每 十 分 钟 就 要 执行 一 次 EXPLAIN ANALYZE VERB0SE， 那 么 每 次 完全 重 输 一 
遍 会 很 烦人 ， 可 以 为 它 起 一 个 别名 。 

















\set eav 'EXPLAIN ANALYZE VERBOSE ' 

















这 样 在 任何 需要 用 到 EXPLAIN ANALYZE VERBOSE 命令 的 地 方 ， 都 可 键入 :eav 替代 (前卫 


冒号 表示 这 是 一 个 需要 展开 的 命令 变量 )。 


i 的 


:eav SELECT COUNT(*) FROM pg_tables; 




















你 其 至 可 以 把 常用 查询 做 成 别名 存 入 psqlrc 文件 中 ， 就 类 似 前 面 出 现 过 的 qstats91 和 
qstat92 一 样 。 我 们 建议 别名 使 用 小 写字 母 ， 以 避免 与 psql 环境 变量 冲突 ， 环 境 变 量 都 是 
大 写 的 。 





3.3.5 ”取出 前 面 执 行 过 的 命令 行 

跟 许多 命令 行 工 具 一 样 ， 你 在 psql 中 也 可 以 用 向 上 方向 键 快速 找 出 之 前 执行 过 的 历史 命 
令 。HISTSIZE 环境 变量 决定 了 系统 存储 的 历史 命令 行 的 数量 。 例 如 : \set HISTSIZE 10 会 
将 可 追溯 的 历史 命令 数量 设 定 为 最 多 10 条 。 





如 果 你 正在 编写 一 个 非常 复杂 的 查询 语句 或 者 执行 一 系列 很 关键 的 更 新 操作 ， 那 么 可 能 会 
需要 将 这 些 语句 存 入 指定 的 文件 中 以 备 后 查 ， 可 以 使 用 HISTFILE 环境 变量 来 实现 此 功能 。 








\set HISTFILE ~/.psql_history- :HOST - :DBNAME 





Windows 环境 下 不 支持 保存 历史 命令 ， 除 非 是 使 用 Cygwin 来 模拟 Unix 
环境 。 





邮 


3.4 ”psql 使 用 技巧 


本 市 中 ， 我 们 将 向 你 介绍 一 些 被 潭 没 在 大 量 的 psql 文档 中 的 特殊 技巧 。 








3.4.1 执行 shell 命 令 


psql 中 通过 \! 可 以 直接 执行 操作 系统 命令 。 比 如 你 使 用 的 是 Windows 环境 ， 需 要 列 出 当前 
工作 目录 的 内 容 ， 那 么 不 需要 退出 psql 环境 ， 只 需要 直接 在 psql 界面 上 执行 \! dir 即 可 。 











3.4.2 ”用 watch 命 令 重复 执行 语句 


\watch 命令 是 PostgreSQL 9.3 版 中 为 psql 引入 的 一 项 新 功能 。 它 可 以 实现 以 固定 的 频率 反 
复 执行 某 个 语句 ， 以 便 持续 观察 其 输出 。 例 如 你 需要 持续 监控 系统 中 当前 正在 执行 的 所 有 
语句 的 情况 ， 那 么 可 以 执行 示例 3-3 中 的 操作 。 


示例 3-3: 每 10 秒 钟 查询 一 次 所 有 数据 库 连 接 上 的 活跃 负载 
SELECT datname, waiting, query 
FROM pg_stat _activity 
WHERE state = 'active' AND pid != pg_backend pid(); \watch 10 





虽然 设计 \watch 命令 的 本 意 是 用 于 反复 执行 监控 类 查询 语句 以 便于 持续 观察 系统 状态 ， 但 
你 也 可 以 将 其 用 于 重复 执行 其 他 指定 的 语句 ，watch 命令 并 不 关心 语 名 本身 的 内 容 是 什么 。 
比如 ， 示 例 3-4 实现 了 每 5 秒 记 录 一 次 系统 负载 信息 。 




















示例 3-4: 每 5 秒 记 录 一 次 系统 负载 情况 
SELECT \* INTO log_activity FROM pg_stat_activity; © 
INSERT INTO log_activity SELECT * FROM pg_stat_activity; \watch 5 @ 





@ 以 pg_stat_activity 为 模板 新 建 一 张 结构 和 数据 都 完全 相同 的 log_activity 表 。 
@ 每 5 秒 重复 一 次 将 pg_stat_activity 最 新 数据 导入 log_activity 的 动作 。 





如 果 需 要 终止 watch 进程 ， 请 执行 CTRL-X 加 CTRL-C。 很 显然 ，watch 动作 一 定 是 只 能 在 
psql 的 交互 模式 下 使 用 。 





你 可 以 在 Michael Paquier 的 博文 “psql 中 watch 功能 的 使 用 ”(http://michael.otacoo.com/ 
postgresql-2/postgres-9-3-feature-highlight-watch-in-psqy) 中 找到 更 多 关于 watch 用 法 的 例子 。 


3.4.3 显示 对 象 信息 

有 多 条 psql 命令 都 能 用 于 显示 数据 库 对 象 列 表 ， 并 附带 给 出 每 个 对 象 的 详细 信息 。 示 例 
3-5 展示 了 如 何 列 出 pg_catalog 中 以 pg_t 打头 的 所 有 表 的 信息 ， 同 时 附带 这 些 表 所 占 空间 
的 大 小 。 
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示例 3-5: 使 用 \dt+ 命令 列 出 表 信 息 
\dt+ pg_catalog.pg_t* 


Schema | Name | Type | Owner | Size | Description 
----------- +------------------+-------+----------+--------+------------- 
pg_catalog | pg_tablespace | table | postgres | 40 kB | 

pg_catalog | pg_trigger | table | postgres | 16 kB 

pg_catalog | pg_ts_config | table | postgres | 40 kB | 

pg_catalog | pg_ts config map | table | postgres | 48 kB | 

pg_catalog | pg_ts_dict | table | postgres | 40 kB 

pg_catalog | pg_ts_parser | table | postgres | 40 kB | 

pg_catalog | pg_ts template | table | postgres | 40 kB | 

pg_catalog | pg_type | table | postgres | 112 kB | 





如 果 需 要 查询 某 个 特定 对 象 的 详细 信息 ， 可 以 使 用 \d+ 命令 。 示 例 3-6 演示 了 如 何 查 HH 
pg_ts_dict 表 的 详细 信息 : 


LE 


示例 3-6: 通过 \d+ 命令 得 到 对 象 的 详细 信息 
\d+ pg_ts_dict 


表 "pg_catalog.pg_ts_dict" 


Column | Type | Modifiers | Storage | Stats target | Description 
--------------- +------+-----------+----------+--------------+------------- 
dictname | name | not null | plain | | 
dictnamespace | oid | not null | plain | | 

dictowner | oid | not null | plain | | 

dicttemplate | oid | not null | plain | | 
dictinitoption | text | | extended | | 

Indexes: 


"pg_ts_dict dictname_index" UNIQUE, btree (dictname, dictnamespace) 
"pg_ts_dict oid index" UNIQUE, btree (oid) 
Has OIDs: yes 


3.5 ”使 用 psql 实 现 数据 的 导入 和 导出 


psql 支持 一 个 叫 作 \copy 的 命令 ， 该 命令 可 以 将 数据 导出 到 文本 文件 中 ， 同 时 也 可 以 从 
文本 文件 中 导入 数据 。 文 本 文件 中 默认 使 用 制 表 符 作为 分 隔 符 ， 当 然 你 也 可 以 指定 使 用 
其 他 分 隔 符 。 文 本 中 必须 使 用 换行 符 来 分 隔 不 同 的 行 ， 否 则 无 法 正确 区 分 两 行 记 录 。 我 
们 采用 美国 人 口 普 查 数据 网 站 (http://factfinder2.census.gov/) 上 提供 的 马萨诸塞 州 人 口 统 
数据 来 作为 我 们 的 第 一 个 例子 。 你 可 以 从 链接 http://www.postgresonline.com/downloads/ 
postgresql_book_2e.zip 中 下 载 我 们 接 下 来 要 用 到 的 DEC_10_SF1_QTHI1_with_ann.csv 文件 。 












































局 








3.5.1 使 用 psql 进 行 数 据 导 
需要 导入 非 规 范 化 数据 或 者 需要 导入 我 们 不 太 了 解 其 特征 的 数据 时 ， 我 们 一 般 建议 这 人 么 
做 : 首先 ， 新 建 一 个 独立 的 schema 来 作为 数据 过 渡 区 ， 然 后 将 新 数据 导入 此 schema 中 ，; 
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然后 ， 通 过 一 些 查询 来 摸 清 这 些 数据 的 特性 ， 最 后 才 把 这 些 数据 分 门 别 类 导入 到 正式 的 产 
品 表 中 并 删除 之 前 建立 的 过 渡 区 schema。 


在 将 数据 导入 PostgreSQL 之 前 ， 需 要 先 建立 一 张 表 来 容纳 新 数据 ， 而 且 表 的 列 数 和 数据 类 
型 必须 与 待 导 入 的 数据 一 致 。 如 果 一 个 待 导 入 的 文本 文件 的 内 部 列 和 记录 结构 清晰 有 序 ， 
那么 这 个 建 表 步骤 理论 上 是 可 以 省 略 的 ， 因 为 psql 可 以 自动 判断 每 个 列 的 类 型 并 自动 把 表 
建 好 ， 但 为 了 避免 出 现 psql 自动 判断 数据 类 型 出 错 的 情况 ， 我 们 认为 这 个 步骤 最 好 不 要 省 
略 。psql 把 整个 导入 过 程 当成 一 个 完整 的 事务 来 处 理 ， 因 此 如 果 导 入 数据 时 遇 到 任何 错误 ， 
那么 整个 导入 动作 所 做 的 修改 会 完全 回 滚 掉 。 如 果 你 对 源 文件 中 数据 的 特点 并 不 完全 了 
解 ， 我 们 建议 你 用 最 宽松 的 条 件 来 建 容 纳 表 ， 等 数据 导入 之 后 再 对 数据 进行 细 化 加 工 。 例 
如 ， 如 果 你 不 确定 某 一 列 是 否 全 都 是 数字 ， 那 么 可 以 将 该 列 的 数据 类 型 设置 为 character 
varying， 等 数据 导入 之 后 再 执行 检查 ， 然 后 稍 后 再 进行 转换 。 



















































































打开 psql 并 执行 示例 3-7 中 的 命令 。 
示例 3-7: 使 用 psql 导入 数据 


\connect postgresqL_book 
\cd /postgresql_book/ch03 
\copy staging.factfinder_import FROM DEC_10_SF1_QTH1_with_ann.csv CSV 


上 面 的 示例 中 ， 我 们 在 psql 的 交互 模式 下 执行 了 导入 过 程 : 首先 连接 数据 库 ， 然 后 使 用 
\cd 切换 到 含有 数据 源 文件 的 目录 ， 最 后 再 执行 \copy 导入 动作 。 因 为 \copy 命令 支持 的 
默认 分 阳 符 是 制 表 符 ， 所 以 我 们 必须 在 命令 行 中 额外 指明 源 文件 是 用 逗号 作为 分 阳 符 的 
CSV 格式 。 


如 有 果 源 文件 使 用 了 一 些 非 标准 的 分 隔 符 ， 比 如 竖 枉 “| ， 那 么 也 请 在 命令 中 指明 ， 














\copy sometable FROM somefile.txt DELIMITER '|'; 
如 果 和 希望 把 文本 中 的 空 值 蔡 换 为 别 的 内 容 再 导入 ， 可 以 用 NULL As 来 标记 要 替换 的 内 容 : 


\copy sometable FROM somefile.txt NULL As '' 


请 不 要 将 psql 中 的 \copy 命令 与 SQL 语言 提供 的 COPY 语句 相 混 淆 。psql 是 
一 个 客户 端 工具 ， 所 有 路 径 都 是 相对 于 已 连接 客户 端 进行 解释 的 。 而 SQL 
copy 是 基于 服务 器 的 ， 并 在 postgrese 服务 操作 系统 账户 的 环境 下 运行 。 项 
此 输入 文件 必须 驻 留 在 可 由 postgres 服务 账户 访问 的 路 径 中 。 我 们 在 “使 
用 psql 导入 固定 宽度 数据 ”这 篇 博文 (http://www.postgresonline.com/journal/ 
archives/157-Import-fixed-width-data-into-PostgreSQL-with-just-psql.html) 中 详 
细 介 绍 了 二 者 的 区 别 。 
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3.5.2 ”使 用 psql 进 行 数据 导出 

psql 的 数据 导出 功能 比 导 入 功能 更 简单 、 更 灵活 ， 你 甚至 可 以 指定 仅 导出 某 张 表 的 某 一 部 
分 记录 。 导 出 时 使 用 的 依然 是 psql 的 \copy 命令 。 示 例 3-8 中 ， 我 们 将 演示 如 何 将 前 面 刚 
刚 导入 库 中 的 数据 再 导 回 (以 制 表 符 为 分 隔 符 ) 到 文本 中 。 


示例 3-8: 使 用 psql 导出 数据 
\connect postgresqL_book 
\copy (SELECT * FROM staging.factfinder_import WHERE s01 ~ E'^[0-9]+' ) TO '/ 
test .tab 
WITH DELIMITER E'\t' CSV HEADER 




















默认 情况 下 psql 导出 数据 时 会 使 用 tab 键 作 为 分 隔 符 。 然 而 ， 以 这 种 格式 导出 时 默认 不 导 
出 标题 行 ， 你 可 以 通过 指定 HEADER 选项 来 要 求 导 出 标题 行 〈 详 见 示例 3-9)， 请 注意 该 选 
项 仅 当 输出 格式 为 CSV 时 才 可 使 用 。 


示例 3-9: 使 用 psql 导出 数据 
\connect postgresqL_book 
\copy staging.factfinder_import TO '/test.csv' WITH CSV HEADER QUOTE '"' FORCE 
QUOTE * 


























FORCE QUOTE * 0 这 个 引用 符 默 认 就 是 双 引 号 ， 但 
为 清晰 起 见 ， 我 们 还 是 显 式 指定 


3.5.3 ”从 外 部 程序 复制 数据 以 及 将 数据 复制 到 外 部 程序 

从 PostgreSQL 9.3 版 开始 ，psql 开始 支持 从 命令 行程 序 的 输出 中 取 数 据 并 将 数据 转 储 到 表 
中 ， 这 类 命令 行程 序 包括 curL、1Ls 和 wget 等。 示例 3-10 演示 了 如 何 使 用 dir 命令 将 一 个 
目录 下 的 文件 列表 导入 表 中 。 


示例 3-10: 使 用 psql 导入 某 个 目录 下 的 文件 列表 
\connect postgresqL_book 
CREATE TABLE dir list (filename text); 
\copy dir_list FROM PROGRAM 'dir C:\projects /b' 

















Hubert Lubaczewski 在 他 的 博文 “以 基于 管道 的 方式 将 数据 复制 到 外 部 程序 或 者 从 外 部 程 
序 复制 数据 ”(http://www.depesz.com/2013/02/28/waiting-for-9-3-add-support-for-piping-copy- 
tofrom-an-external-program/) 中 介绍 了 更 多 关于 使 用 \copy 命令 的 例子 。 


3.6 ”使 用 psql 制 作 简 单 的 报表 


你 也 许 会 觉得 难以 置信 ， 但 psql 的 确 能 够 制作 简单 的 HTML 报表 。 请 执行 以 下 命令 并 查 
看 输出 的 HTML 报表 ， 应 该 是 类 似 图 3-1 所 展示 的 样子 。 


























psql -d postgresqL_book -H -c 

"SELECT category, count(*) As num_per_cat 
FROM pg_settings 

WHERE category LIKE “'%Query% 

GROUP BY category 

ORDER BY category;" -0o test.html 




















category num per cat 
Query Tuning / Genetic Query Optimizer 了 
Query Tuning /Other Planner Options 下 5 
Query Tuning / Planner Cost Constants 6 
Query Tuning / Planner Method Configuration 11 
Statistics / Query and Index Statistics Collector | 6 





(5 rows) 








图 3-1: 简单 HTML 报表 














下 的 报表 看 起 来 还 算 凑 合 ， 但 这 仅仅 是 输出 了 一 个 HTML 表格 ， 还 称 不 上 是 一 个 完全 符 


合格 式 要 求 的 HTML 文档 。 为 了 让 本 报表 的 内 容 更 丰富 一 些 ， 我 们 需要 写 一 个 脚本 来 作为 





辅助 ， 内 容 见 示例 3-11。 


示例 3-11: 编写 settings_report.psql 文件 来 设置 报表 内 容 


\o _ settings_report.htmt © 

\T 'cellspacing=0 ceLLpadding=0' @ 

\qecho '<html><head><style>H2{color:maroon}</style>' © 

\qecho '<title>PostgreSQL Settings</title></head><body>' 

\qecho '<table><tr valign="''top''><td><h2>Planner Settings</h2>' 

\xon@ 

\t on 日 

\pset format htmL @ 

SELECT category, string agg(name || "=' || setting, E'\n' ORDER BY name) As set- 
tings @ 

FROM pg_settings 

WHERE category LIKE '%Planner%' 

GROUP BY category 

ORDER BY category; 

\H 

\qecho '</td><td><h2>File Locations</h2>' 

\x off @ 

\t on 

\pset format html 

SELECT name, setting FROM pg_settings WHERE category = 'File Locations' ORDER BY 
Name; 

\qecho '<h2>Memory Settings</h2>" 

SELECT name, setting, unit FROM pg_settings WHERE category ILIKE '%memory%' ORDER 
BY name; 

\qecho '</td></tr></table>' 

\qecho '</body></html>' 

\o 
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指定 查询 结果 输出 到 一 个 文件 中 。 

HTML 表格 的 输出 格式 设置 。 

添加 一 些 附 加 的 HTML 代码 。 

打开 记录 输出 的 展开 模式 。 即 重复 每 一 个 记录 的 列 标题 ， 并 将 每 一 个 记录 的 每 一 列 作 

为 一 个 单独 的 记录 输出 。 

日 设置 “是 否 仅 输出 记录 ”开关 。 如 果 此 开关 是 打开 的 ， 则 会 包 略 列 标题 和 行 计 数 。 

@ 指定 按 HITML 表格 格式 输出 结果 。 

@ string_agg() 是 PostgreSQL 9.0 版 引入 的 一 个 国 数 ， 可 以 将 聚合 运算 中 被 划 为 同 组 的 字 
符 串 值 合并 为 单个 字符 串 。 

@ 关闭 记录 输出 的 展开 模式 ， 这 样 第 二 个 和 第 三 个 查询 结果 在 报表 上 的 输出 格式 应 该 是 

每 条 记录 仅 占 一 行 。 








© © © © 











示例 3-11 演示 了 通过 灵活 使 用 SQL 和 psql 命令 可 以 创建 出 一 个 内 容 丰富 的 综合 性 分 层 
报表 。 要 运行 上 面 示例 中 的 脚本 有 两 个 方法 : 可 以 使 用 psql 以 交互 方式 连接 并 执行 \i 
settings_report.psqL， 也 可 以 在 操作 系统 的 命令 行 界 面 上 运行 psql -f settings_report. 
psql。settings_report.html 生成 的 输出 结果 如 图 3-2 所 示 。 

















Planner Settings File Locations 





config file IC:/projects/pg/pg92edb/data/postgresql. conf 
category Query Tuning / Other Planner Options |data directory |C:/projects/pg/pg92edb/data 














settings constraint exclusion=partition lexternal_pid file 
cursor_tuple_fraction=0.1 hba_file Ci/projects/pg/pe92edb/data/pg_hba conf 
default_statistics_target=100 ident file IC-/projects/pg/pg92edby/data/pg ident.conf | 





from_collapse_limit=8 
join_collapse limit=8 


Memory Settings 





category Query Tuning / Planner Cost Constants 





























settings cpu_index_tuple_cost=0.005 Imaintenance work mem |16384kB | 
cpu_operator_cost=0.0025 Imax_ prepared _ transactions 0 | | 
cpu_tuple_cost=0.01 Imax_stack_depth 2048 kB | 
effective_cache size=16384 shared buffers 4096 8kB| 

random page_cost=4 temp_buffers 1024 8kB| 
seq_page_cost=1 ltrack activity query size |1024 | | 

Iwork mem 1024 kB | 











category Query Tuning / Planner Method 
Configuration 

settings enable_bitmapscan=on 
enable_ hashagg=on 
enable hashjoin=on 
enable_indexonlyscan=on 
enable_indexscan=on 


一 tw bl 




















3-2: 复杂 HTML 报表 


通过 以 上 脚本 ， 可 以 实现 将 多 个 查询 的 输出 结果 整合 到 一 个 报表 中 ， 如 果 要 定时 生成 此 报 
表 ， 请 使 用 pgAgent 或 者 crontab。 





第 4 章 
pgAdmin 的 使 用 





pgAdmin 是 一 款 PostgreSQL 图 形 化 管理 工具 ， 其 可 靠 性 和 实用 性 已 久 经 验证 ， 目 前 已 发 
展 到 第 三 个 大 版 本 ， 一 般 称 为 pgAdmin II。 虽 然 该 工具 有 其 人 缺点， 但 开发 组 对 bug 的 修复 
一 直 都 很 及 时 ， 而 且 也 在 不 停 地 为 其 添加 新 的 功能 特性 。 因 为 其 定位 是 PostgreSQL 官方 的 
图 形 化 管理 工具 ， 并 且 在 很 多 PostgreSQL 发 行 包 中 都 会 附带 ， 所 以 它 会 一 直 与 最 新 版 本 
的 PostgreSQL 保持 同步 更 新 。 如 果 新 版 本 的 PostgreSQL 中 引入 了 一 个 新 特性 ， 那 么 最 新 
版 本 的 pgAdmin 中 一 定 会 支持 对 此 特性 进行 管理 。 如 果 你 是 PostgreSQL 新 手 ， 那 么 选择 
pgAdmin 作为 入 门 工 具 肯 定 没 错 。 






























































4.1 pgAdmin 入 门 


你 可 以 从 pgAdmin 的 官网 www.pgadmin.org 下 载 pgAdmin 的 安装 包 ， 网 站 上 还 提供 了 
pgAdmin 的 使 用 手册 ， 你 可 以 仔细 研读 一 下 。 该 工具 的 功能 设计 清晰 有 序 ， 而 且 大 部 分 
功能 是 自 解释 的 ， 也 就 是 说 你 仅 赁 摸索 而 无 需 专门 指导 即 可 了 解 其 使 用 方法 。 对 于 那些 爱 
“尝鲜 ”的 人 们 来 说 ， 可 以 尝试 使 用 测试 版 ，PostgreSQL 社区 将 很 感谢 你 对 测试 版 进行 试 
用 并 反馈 bug。 








4.1.1 功能 概览 


下 面 会 先 列 出 我 们 认为 最 精华 的 部 分 功能 ， 不 过 这 只 是 小 试 和 牛刀， 更 多 内 容 请 参见 
pgAdmin 官网 上 的 功能 介绍 页 面 (http:/pgadmin.org/features.php ) 。 
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执行 计划 的 图 形 化 解释 功能 
该 功能 能 够 以 图 形 化 方式 展示 规划 器 的 内 部 工作 过 程 ， 有 了 该 功能 以 后 就 不 再 需要 在 见 
长 难 懂 的 执行 计划 文本 中 艰难 跋涉 寻求 真相 了 。 




















SQL 执行 面板 

不 管 在 界面 上 执行 什么 样 的 操作 ，pgAdmin 最 终 也 是 要 通过 SQL 语句 来 与 PostgreSQL 
服务 端 进 行 交互 ， 系 统 允许 你 查看 这 种 底层 SQL。 当 你 使 用 图 形 化 界面 对 数据 库 服务 
器 进行 操作 时 ，pgAdmin 会 自动 在 SQL 窗 格 中 展示 这 些 自 动 生成 的 SQL 语句 。 对 于 新 
手 来 说 ， 研 究 这 种 自动 生成 的 SQL 是 极 好 的 学 习 途 径 。 对 专家 来 说 ， 好 好 利用 这 种 自 
动 生成 的 SQL 可 以 节省 大 量 时 间 。 









































postgresql.conf 和 pg_hba.conf 等 配置 文件 的 图 形 化 编辑 器 
你 不 再 需要 四 处 寻找 配置 文件 的 位 置 并 使 用 文本 编辑 器 来 修改 它们 ， 在 pgAdmin 上 可 
以 一 站 式 搞定 。 























数据 导入 和 导出 

pgAdmin 能 够 轻易 地 将 语句 查询 结果 导出 为 CSV 文件 或 者 基于 其 他 分 隔 符 的 文本 文件 ， 
当然 也 可 以 将 这 类 文件 导入 到 数据 库 中 。 它 甚至 支持 将 表 数 据 导 出 为 HTML 格式 ， 因 
此 可 以 当 作 一 个 简易 的 一 键 式 报表 服务 器 来 用 。 




















备份 与 恢复 向 导 

如 果 你 记 不 住 pg_restore 和 pg_dump 命令 的 大 量 选项 ， 那 没关系 ，pgAdmin 提供 了 一 
个 很 友好 的 图 形 化 界面 来 帮 你 设 定 这 些 选项 ， 通 过 调整 这 些 选 项 可 以 实现 对 datapase、 
schema、 单 张 表 以 及 全 局 对 象 进行 定制 化 的 备份 或 者 恢复 。 你 可 以 在 备份 恢复 界面 的 
“消息 ”选项 卡 上 看 到 系统 自动 生成 的 pg_dump 或 pg_restore 命令 行 语句 ， 如 果 你 觉得 
有 必要 ， 完 全 可 以 把 这 些 语句 复制 下 来 作为 例句 使 用 。 



















































































授权 向 导 
该 功能 可 以 帮助 你 一 次 性 对 很 多 数据 库 对 象 进行 授权 或 者 解除 授权 操作 ， 从 而 大 大 节省 
你 的 时 间 。 








pgScript 脚 本 执行 引擎 

pgScript 是 一 种 速度 很 快 但 不 大 “正规 ”的 脚本 执行 机 制 ， 该 机 制 不 要 求 整个 脚本 中 执 
行 的 所 有 操作 构成 一 个 事务 。 在 pgScript 中 ， 你 可 以 在 一 个 循环 语句 的 每 一 次 循环 中 都 
执行 一 次 提交 操作 ， 如 果 是 在 函数 中 ， 那 么 只 能 是 所 有 循环 都 结束 了 最 后 才能 执行 提 
交 。 很 遗憾 的 是 ， 这 种 灵活 的 机 制 只 能 在 pgAdmin 中 使 用 。 











。 插件 架构 
该 架构 让 用 户 只 需 点 一 下 鼠标 即 可 加 载 一 个 新 的 pgAdmin 插件 。 你 其 至 可 以 通过 此 机 
制 来 加 入 你 自己 开发 的 插件 。 我 们 在 “pgAdmin II 1.1.3 版 中 插件 机 制 的 变化 ”这 篇 博 
文 (http:Wwww.postgresonline.comy/journalarchives/180-pgAdmin113plugins_postgis.html) 
中 讨论 了 该 特性 。 





。 pgAgent 定 时 任务 工具 
pgAgent 是 一 种 跨 平台 的 定时 任务 计划 工具 ， 我 们 后 续 将 使 用 一 整 节 的 篇 幅 来 介绍 它 。 
pgAdmin 提供 了 一 套 很 完善 的 用 于 访问 pgAgent 的 接口 。 




















4.1.2 如何 连接 到 PostgreSQL 服 务 器 
通过 pgAdmin 连接 到 PostgreSQL 服务 器 是 很 简单 的 ， 其 属性 页 和 高 级 功能 页 面 如 图 4-1 
所 示 。 
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Store password 园 
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Group Servers 
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图 4-1: pgAdmin 注册 服务 器 连接 对 话 框 


4.1.3 pgAdmin 界 面 导航 
pgAdmin 界面 左 侧 的 树 状 目录 布局 看 起 来 很 直观 ， 其 中 展示 了 所 有 的 数据 库 对 象 。 你 可 以 
进入 Options (选项 ) 选项 卡 中 ， 勾 选 掉 你 不 希望 看 到 的 数据 库 对 象 类 型 ， 这样 左 侧 的 目录 
树 就 会 精简 很 多 。 可 以 通过 菜单 栏 上 的 Tools (工具 ) 一 Options (选项 ) 一 Browser( 浏 
览 嚣 ) 来 打开 目录 树 定制 面板 ， 你 将 看 到 如 图 4-2 的 界面 。 
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General | Preferences :E 


v Databases 

v Tablespaces 

w pgagent Jobs 

Y Groupsjgroup Roles 

Y Usersjlogin Roles 

YI Resource Queues 

Y Catalogs 

Y Casts 

Yi Foreign Data Wirappers 

Y Foreign Servers 

w User Mappings 

Y Foreign Tables 

YI Languages 

WY 5ynonyms 

Y 5chemas 

Y Slony-I Clusters 

Y Aggregates 

v Collations 
Conversions 

w Domains 

VY Extensions 

w Functions 

YI Trigger Functions 

Y Packages 

VY Procedures 

Y Operators 

Y Operator Classes 

Y Operator Families 

V| senupnrPs 


习 Query Tool | Query Tool files | Colours | Logging | 
If 5how 5ystem Objects in the treeview 
Display the following database objects: 

















图 4-2: 在 pgAdmin 的 树 状 浏览 目录 中 隐 





藏 或 者 显示 特定 类 型 的 数据 库 对 象 





如 果 在 界 
内 部 对 象 ， 包 括 内 部 函数 、 系 统 表 、 
中 存储 的 元 数据 ， 包 括 information 











面 上 勾 选 了 “在 树 状 目录 中 显示 系统 对 象 ”， 那 么 你 将 看 到 PostgreSQL 服务 器 的 


表 的 隐藏 列 等 。 你 还 将 看 到 PostgreSQL 系统 schema 
_schema 和 pg_catalog 这 两 个 catalog 中 的 内 容 。 其 


中 information_schema 是 ANSI SQL 标准 中 规定 必须 要 有 的 ， 因 此 在 别 的 数据 库 (比如 


MySQL 和 SQL Server) 中 也 会 存在 。 
过 的 表 和 列 。 





pgAdmin 左 侧 的 目录 树 并 





人 Eb 人 
HE 去 


你 可 





认 出 一 些 在 使 用 其 他 数据 库 产品 时 曾经 见 


不 总 是 和 数据 库 服务 端 实时 保持 一 致 的 。 例 如 ， 如 





果 有 人 通过 一 个 会 话 连接 到 服务 端 并 修改 了 某 表 的 结构 ， 此 时 另 一 个 人 通过 


另 一 个 会 话 打开 的 pgAdmin 


版 本 中 有 一 个 设置 ， 可 用 
时 延 。 


4.2 pgAdmin 功 能 


pgAdmin 工具 的 功能 丰富 而 强大 ， 本 和 











目录 视图 上 的 表 结 构 并 不 会 实时 更 新 。 在 最 新 的 
于 强制 自动 刷新 ， 但 请 理解 无 论 如 何 都 会 有 一 定 的 














性 介绍 





的 篇 幅 不 足以 完全 描述 ， 因 此 我 们 仅 重点 介绍 一 些 





AS 1 兰 
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比较 常用 的 功能 。 


4.2.1 在 pgAdmin 中 调用 psql 

尽管 pgAdmin 拥有 功能 强大 的 图 形 界面 ， 但 有 些 时候 还 是 离 不 开 psql。 比 如 需要 执行 pg_ 
dump 或 其 他 数据 转 储 工具 生成 的 体积 庞大 的 SQL 文件 时 ，psql 就 更 合适 。 从 pgAdmin 
界面 上 可 以 很 容易 地 打开 psql 工具 ， 只 需 点 击 “ 插 件 ” 菜 单 下 的 “PSQL Console” 项 即 
可 ， 如 图 4-3 所 示 。 这 样 就 会 启动 一 个 psql 窗口 并 连接 到 当前 pgAdmin 环境 中 已 连接 的 
database 上 ， 然 后 你 可 以 使 用 \cd 以 及 \i 命 令 来 改变 目录 并 执行 SQL 文件 。 


.Hb 


PSQL Console 




































































4-3: psql 插件 





请 注意 ; 该 功能 需要 确保 针对 某 database 的 连接 已 建立 好 ， 因 此 只 有 当 pgAdmin 已 连 上 
PostgreSQL 服务 器 并 选中 某 个 database 时 ,“ 插 件 ” 菜 单 下 的 “PSQL Console” 项 才 会 变 
成 可 用 状态 。 














4.2.2 在 pgAdmin 中 编辑 postgresql.conf 和 pg_hba.conf 
文件 


只 要 服务 器 上 安装 了 adminpack 扩展 包 ， 你 就 可 以 在 pgAdmin 界面 上 直接 编辑 配置 文件 。 
一 般 来 说 ，PostgreSQL 的 一 键 式 安装 包 都 会 自动 安装 好 adminpack 扩展 包 ， 你 可 以 看 到 
Server Configuration (服务 器 配置 ) 菜单 已 启用 ， 如 图 4-4 所 示 。 



























Server Configuration postgresql,conf 
pg_hba,conf 





Rounrnow 











Server Status 





4-4: pgAdmin 配置 文件 编辑 器 





如 果 你 的 pgAdmin 已 连接 到 PostgreSQL 服务 器 但 Server Configuration (服务 器 配置 ) 菜单 
却 是 灰 的 ， 那 么 要 么 是 没 安装 adminpack， 要 么 是 你 不 是 以 超级 用 户 身份 登录 的 。 如 果 要 
在 PostgreSQL 9.0 或 者 更 早 版 本 的 服务 器 上 安装 adminpack， 请 以 postgres 超级 用 户 身份 
登录 然后 运行 脚本 share/contrib/adminpack.sql。 对 于 PostgreSQL 9.1 以 及 之 后 的 版 本 来 说 ， 
请 以 postgres 用 户 身 份 登 录 并 执行 CREATE EXTENSION adminpack， 或 者 也 可 以 通过 图 形 界 
面 来 安装 ， 如 图 4-5 所 示 。 安 装 好 以 后 请 断 开 与 服务 器 之 间 的 连接 并 重 连 ， 然 后 就 可 以 看 
到 菜单 已 可 点 击 。 
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BO postores 
由 Catalogs (3) 
Casts (0) 
日 从 Extensions (1) | 只 New Extension... 
plpgsql 





























属 Foreign Data Properties |Definiton | SQL 
四 -< Languages (1) | | Name Bdminpadk] 日 
由 二 Schemas (1) dminpack 
Re acmnca 
J) Slony Replicai oD autoinc 加 
btree_gin 
btree_gist 
be hin=ee 





4-5: 使 用 pgAdmin 安装 扩展 包 


4.2.3 ”创建 数据 库 资产 并 设置 权限 

pgAdmin 允许 你 创建 各 种 数据 库 资 产 并 对 其 进行 权限 设置 。 

1. 创建 数据 库 以 及 其 他 数据 库 资 产 

利用 pgAdmin 创建 一 个 新 的 数据 库 是 非常 简单 的 ， 只 需 右 键 单 击 树 上 的 database 节点 并 选 
择 New Database (新 建 数 据 库 ) 即 可 ， 如 图 4-6 所 示 。Definition (定义 ) 选项 卡 上 提供 了 
一 个 下 拉 菜 单 供 选 择 建 库 所 用 的 模板 数据 库 ， 我 们 在 2.4.1 市 中 介绍 过 相关 内 容 。 




































































i 加 
白 自 0 
由 - 国 ee 
由 - 国 耻 New Database... 
Properties | Definition |Variables | Privieges | Security Labels | SQL 
田 - 几 Grd]|| Encoding [us 
由 总 





Template | 








Tablespace | <default tablespace> 








咱 | Collation 





Character type 


Connection Limit " 























4-6: 创建 新 数据 库 


创建 角色 、schema 和 其 他 数据 库 资产 的 步骤 是 类 似 的， 都 有 一 些 对 应 的 相关 页 面 供 你 设置 
其 他 属性 。 


2. 权限 管理 

在 PostgreSQL 数据 库 资产 权限 管理 方面 ， 不 会 有 比 pgAdmin 的 授权 向 导 更 好 的 管理 工具 
了 ， 你 可 以 通过 菜单 栏 上 的 Tools (工具 ) 一 Grant Wizard (授权 向 导 ) 打开 其 页 面 。 如 同 
其 他 许多 功能 项 一 样 ， 在 成 功 连 到 数据 库 之 前 ， 其 菜单 项 一 直 都 是 灰 的 。 另 外 该 全 单项 对 
于 当前 树 状 目录 上 的 焦点 位 置 也 很 敏感 ， 点 击 到 不 同位 置 时 ， 该 菜单 项 就 会 显示 出 可 用 或 
者 不 可 用 等 不 同 状态 。 例 如 ， 要 为 cesus 这 个 schema 中 的 项 设置 权限 ， 请 在 目录 树 上 选中 
此 schema 并 点 开 授 权 向 导 ， 界 面 如 图 4-7 所 示 。 然 后 你 就 可 以 选择 所 有 或 者 部 分 项 ， 然 后 
切换 到 “权限 ”选项 卡 上 以 设置 你 想 要 授予 的 角色 和 权限 。 
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入 privileges for schema census 

















Sequence census.lu_fact_types_fact_type_id_seq 
Table census.facts 

Table census.hisp_pop 

Table census.lu_fact_types 

Table census.lu_tracts 

View census.vw_facts 


















































图 4-7: 授权 向 导 


除了 为 已 有 对 象 授权 以 外 ， 我 们 日 常 遇 到 更 多 的 一 个 场景 是 为 一 个 schema 或 者 database 中 
新 建 的 对 象 设置 默认 权限 。 要 执行 此 类 授权 ， 请 右键 单 击 schema 或 者 database 对 象 节 点 ， 
然后 选择 “属性 ”菜单 项 ， 然 后 在 弹出 的 界面 上 点 击 切 换 到 “上 默认 权限 ”选项 卡 ， 如 图 4-8 
所 示 。 请 注意 :“ 默 认 权 限 ” 这 一 功能 特性 仅仅 适用 于 PostgreSQL 9.0 及 之 后 的 版 本 。 











© Schema contrib 























Properties | Privieges Default Privileges Seaurity Labels | SQL 
Tables [Sequences | Functions | Types 





























Role/Group Privileges 


对 public r 

































































Privileges 

Role/Group public ” 
本 ALL 回 wITH GRANT OPTION 

回 INSERT WITH GRANT OPTION 

贺 SELECT 加 WITH GRANT OPTION 

加 UPDATE | WITH GRANT OPTION 

回 DELETE WITH GRANT OPTION 

回 TRUNCATE 品 wrrm GRANT OPTION 

回 REFERENCES WITH GRANT OPTION 

回 TRIGGER. 器 wrr GRANT OPTION 
























































图 4-8: 默认 授权 管理 
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当 为 schema 授予 默认 权限 时 ， 请 记得 一 定 要 为 相应 的 组 角色 授予 访问 此 schema 的 权限 。 


4.2.4 数据 导入 和 导出 

同 psql 一 样 ，pgAdmin 也 可 以 导入 和 导出 文本 文件 。 

1. 导入 文件 

pgAdmin 的 导入 功能 其 实 是 对 psql 的 \copy 命令 做 了 一 层 封装 ， 并 要 求 导入 数据 的 目的 表 
必须 已 建 好 。 要 实现 数据 导入 ， 请 在 要 导入 数据 的 表 上 单 击 鼠 标 右键 ， 如 图 4-9 所 示 。 
















































园 lu_fact_types 
国 lu_tracts Refresh 
Trigger Functial Co 
Types (6) Ou Columns to import 
ig QQ New Object » v | fact_type_id 
Delete/Drop... i 
ging Pp v | fact_subcats 
Triggers (0) Drop cascaded... ¥ | short_name 
Meplication (0) 
Truncate 


Truncate Cascaded 


Reset table statistics 














Scripts » 
3s (2) : File Options Columns Quote Options | NULL Options 
站 View Data » es 
223) 
ions (2) Reports 上 
YData Wrapper] Maintenance... 
iges (1) 
as (本 Backup... 
Triggers (0) Restore... 


Meplication (0) Import 





Properties... 








| 
act_types,.. Doll 





图 4-9: Import (导入 ) 菜单 


2. 将 数据 导出 为 结构 化 文件 或 者 报表 格式 
除了 导入 数据 ， 你 还 可 以 将 数据 导出 为 分 隔 符 分 隔 的 文本 文件 格式 以 及 HTML 或 者 XML 
格式 。 要 导出 为 分 隔 符 文 本 格式 ， 请 按 以 下 步骤 操作 。 


(1) 打开 查询 窗口 ( 周 )。 

(2) 编写 查询 语句 。 

(3) 执行 查询 语句 。 

(4) 点 击 菜单 栏 上 的 File (文件 ) 一 Export (导出 )。 
(5) 按照 图 4-10 填写 设置 内 容 。 






































六 区 TS 
稳 Export data to file 
Row separator Encoding 
四 了 Local dharset 
加 CR/LF @ Unicode UTF-8 
cal to Se 
olumn separator ， i 
Quote char ”区 @ only strings 
Column names 回 3 all columns 
Filename C:\test.csv 图 
[ok- 一 | 
本 A 




















图 4-10: Export (导出 ) 菜单 


导出 为 HTML 或 者 XML 的 步 又 非常 类 似 ， 唯 一 的 差别 在 于 需要 点 击 菜单 栏 上 的 File ( 文 
件 ) 一 Quick Report (快速 报表 ) 选项 ， 参 见 图 4-11。 














Report Title 
Quick report 


Report Notes 





[Indude the SQL in the report? 
Output format 


® XHTML 1.0 Transitional 
© XML 


Stylesheet 


© Embed the default stylesheet 
DS Embed an external stylesheet (specified file must exist) 
Link to an external stylesheet 


Filename 


Output file c:\test.html 加 
VDpen the output file in the default browser? 


























4-11: 导出 报表 选项 


4.2.5 备份 与 恢复 


pgAdmin 为 pg_dump 和 pg_restore 提供 了 图 形 化 的 操作 界面 ， 相 关上 有 具 体 功 能 已 在 2.7 节 中 
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介绍 过 。 本 节 内 容 中 ， 我 们 将 重复 使 用 一 些 前 面 已 经 使 用 过 的 例子 ， 不 过 是 使 用 pgAdmin 
来 执行 操作 ， 而 非 使 用 命令 行 。 


如 果 你 的 机 器 上 安装 了 多 个 版 本 的 PostgreSQL 或 pgAdmin， 我 们 建议 你 先 确认 pgAdmin 
指向 了 正确 版 本 的 PostgreSQL 的 bin 目录 ( 即 pg_dump、pg_restore 等 命令 行 工 具 所 在 目 
录 )， 可 以 通过 检查 pgAdmin 的 bin 目录 设置 来 确认 ， 如 图 4-12 所 示 。 








从 [3] Options | 
General | Preferences | Browser | Query Tool [Query Tool files | Colours [ioggng 
User language [Default 























| 加 





PG help pa 由 http:/ JJwww.postoresql.orgjdocs/currentjstatic/ 
EDB help path http:/fwww.enterprisedb.com/docs/en/current/server/ 
GP help path http://www.greenplum.com/jdocs/3300/ 


Slonyhelppath _ http://www.slony.info/documentation/ 








System schemas 

seny1path 
PG bin path C:\projects\bg\pg91\bin Browse | 咱 
EDB bin path 
GP bin path Browse 











|Ignore server/utijity version mismatches 





Warning: Backup or restore operations may fail if the PostgreSQL utilities do not 
match the server version 






































图 4-12: pgAdmin File (文件 ) 一 Options (选项 ) 菜单 


如 果 你 是 在 对 一 台 远 程 服务 器 进行 备份 或 者 恢复 操作 ， 或 者 你 操作 的 数据 库 
数量 特别 庞大 ， 那 么 我 们 建议 你 使 用 命令 行 工 具 而 不 要 使 用 pgAdmin， 因 为 
此 种 情况 下 操作 过 程 本 来 就 已 经 很 耗 时 ， 使 用 pgAdmin 操作 会 使 得 耗 时 和 复 
杂 度 增加 。 另 外 也 请 牢记 : 对 于 pg_dump 转 储 的 自 定义 压缩 格式 、TAR 包 格 
式 、 目 录 格 式 这 三 种 二 进 制 格式 的 备份 文件 ， 必 须 使 用 与 pg_dump 相同 或 者 
更 新 版 本 的 pg_restore 工具 来 进行 恢复 。 




















1. 完整 备份 一 个 database 中 的 数据 

在 2.7.1 节 中 ， 我 们 已 经 演示 了 如 何 完 整备 份 一 个 database。 以 下 我 们 使 用 pgAdmin 界面 
重复 演示 一 遍 操作 过 程 ， 请 右键 单 击 待 备份 的 database， 并 选择 Custom ( 自 定义 ) 格式 ， 
如 图 4-13 所 示 。 
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国 亚 列 
Fiename C:\posgresql_book\postgresql_book.backup i 

Format [custom | 
Compress Ratio 

Encoding | >| 
Rolename | 














File Options | Dump Options #1 | Dump Options #2 | Objects | Messages 














图 4-13 


: 备份 database 


2. 备份 系统 级 对 象 


pgAdmin 为 pg_dumpall 提供 了 一 个 图 形 化 界 站 




















i， 用 于 对 系统 对 象 进行 备份 。 要 使 用 该 界 








面 ， 请 先 连接 到 希望 备份 的 PostgreSQL 服务 器 。 然 后 从 顶部 菜单 中 选择 Tools (工具 ) 一 


Backup 





Globals (全 局 备份 )。 


pgAdmin 不 支持 指定 备份 哪些 全 局 对 象 ， 但 在 pg_dumpall 的 命令 行 界面 上 是 可 以 的 。 
pgAdmin 默认 会 备份 所 有 的 系统 表 空 间 和 角色 。 


如 果 你 
Backup 





硬 





Server (备份 服务 器 ) 来 实现 。 


3. 选择 性 地 备份 部 分 数据 库 资产 
pgAdmin 为 pg_dump 的 选择 性 备份 功能 提供 了 一 个 图 形 化 接口 。 在 希望 备份 的 数据 库 资 产 


上 右键 单 击 ， 然 后 在 弹 

















希望 备份 整个 服务 器 端的 所 有 数据 ， 可 以 通过 点 击 菜 单 栏 上 的 Tools (工具 ) 一 

















的 菜单 中 选择 Backup (备份 ) (如 图 4-14 所 示 )。 你 可 以 选择 备 





份 整 个 database、 一 个 特定 的 schema 或 者 任何 其 他 数据 库 资产 。 





























© _ 
人 @ publid Refresh 
@ stagin 
网 New Object » 
下 1c| Delete/Drop... 
守 9 Drop cascaded... 
3 CREATE Script 
后 启 Reports 上 
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| Restore 
SF 
性 Grant Wizard... 
人 @ o 
入 9| Properties... 








图 4-14: pgAdmin 的 schema 备份 




















pgAdmin 的 使 用 


71 











如 果 和 希望 仅 备份 当前 图 形 界面 上 选中 的 数据 库 资 产 ， 那 么 你 可 以 忽略 备份 界面 上 的 其 他 选 
项 卡 (如 图 4-13 所 示 )， 只 用 默认 设置 即 可 。 当 然 ， 你 也 可 以 切换 到 Objects (对 象 ) 选项 
卡 选择 备份 更 多 对 象 ， 如 图 4-15 所 示 。 









































司 > 











区 facts 
区 hisp_pop 


WY lu fact types 
WV lu_tracts 
public 
mallsubscribers 
FF interval_periods 
Tm kg_users 
Fm logs 
Fm logs_2010 
Fm logs_2011 
万 logs_2011 01 02 
FF user_facts 
web_sessions 
厂 xml_bag 

日 -Fstaging 
厂 factfinder_import 
万 pop_import 








File Options | Dump Options #1 | Dump Options #2 Objects 


[ED Case Ce 




















4-15: pgAdmin 的 选择 性 备份 Objects (对 象 ) 选项 卡 


pgAdmin 在 后 台 其 实 就 是 调用 了 pg_dump 命令 行 工具 来 实施 备份 动作 ， 如 果 
你 希望 了 解 pgAdmin 最 终 使 用 的 命令 是 什么 样子 ， 那 么 可 以 在 点 击 Backup 
(备份 ) 按钮 开始 执行 备份 后 切换 到 备份 界面 最 右 侧 的 Messages (消息 ) 选 
项 卡 ， 其 中 会 记录 系统 自动 生成 的 带 实 参 的 pg_dump 命令 行 。 




















4.3 pgScript 脚 本 机 制 


pgScript 是 pgAdmin 内 置 的 一 种 脚本 机 制 ， 非 常 适合 于 重复 执行 SQL 任务 的 场景 。 相 比 
PostgreSQL 的 函数 机 制 ，pgSeript 对 内 存 的 使 用 更 合理 因而 执行 效率 更 高 。pgScript 机 制 
之 所 以 能 达到 这 种 效果 ， 是 因为 PostgreSQL 函数 机 制 会 将 所 有 工作 在 最 后 一 次 性 批量 提 
交 ， 此 前 未 提交 的 工作 成 果 都 保存 在 内 存 中 。 相 比 之 下 ，pgScript 在 运行 脚本 时 每 执行 一 
条 SQL 语句 就 提交 一 次 ， 这 样 就 使 得 pgScript 特别 适合 执行 会 消耗 大 量 内 存 而 又 不 需要 
作为 一 个 完整 事务 来 提交 的 任务 。 一 旦 某 个 事务 被 提交 ， 则 该 事务 占用 的 内 存 会 立即 被 释 
放 ， 这 部 分 内 存 即 可 用 于 下 一 个 事务 。 在 “使 用 pgScript 实现 地 理 编 码 ” 这 篇 博文 (http:// 
www.postgresonline.com/journal/archives/181-pgAdmin-pgScript.html) 中 你 可 以 看 到 我 们 所 
做 的 示例 。 
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pgScript 脚本 语言 是 一 种 弱 类 型 语言 ( 即 定 义 变量 时 无 需 明确 指定 其 类 型 ) ， 支 持 条 件 判 
断 、 循 环 、 数 据 生成 器 、 基 本 的 打印 函数 以 及 记录 型 变量 ， 其 语法 与 微软 SQL Server 数据 
库 所 使 用 的 Transact-SQL 语法 类 似 。 前 面 加 @ 的 是 变量 ， 可 以 存放 标量 或 数组 ， 包 括 SQL 
命令 的 执行 结果 。DECLARE、SET、IF-ELSE、WHILE 等 语法 在 pgScript 中 都 支持 。 











可 以 在 SQL 查询 执行 窗口 中 来 执行 pgScript。 在 窗口 中 输入 脚本 后 ， 点 击 pgScript 
执行 (号 )。 





加 











以 下 我 们 将 演示 一 些 pgScript 脚本 的 例子 。 示 例 4-1 演示 了 如 何 使 用 pgScript 记录 型 变量 
和 循环 语法 来 构建 一 个 交叉 表 ， 使 用 的 基础 表 是 Lu_fact_types， 该 表 是 我 们 在 示例 7-18 
中 创建 的 。 以 下 pgScript 脚本 中 创建 了 一 个 名 为 census.hisp_pop 的 空 表 ， 该 表 有 以 下 数 
字 型 列 : hispanic_or_latino、white_alone 和 black_or_african_american_alone， 以 及 其 


他 一 些 列 。 


示例 4-1: 在 pgScript 中 使 用 记录 型 变量 建 表 
DECLARE @I, @labels, @tdef; 
SET QI = 0; 





变量 Labels 将 用 于 存放 记录 。 
SET @labels = 
SELECT 
quote_ident( 
repLace( 
repLace(Lower(COALESCE(fact_ 
Subcats[4]，fact_subcats[3]))，'” '，' ')，: ，， 
) 
) As col_name, 
fact_type_id 
FROM census.luyu_fact types 
WHERE category = 'Population' AND fact _ subcats[3] ILIKE 'Hispanic or Latino%' 
ORDER BY short_name; 


SET Qtdef = 'census.hisp_pop(tract _ id varchar(11) PRIMARY KEY '; 


使 用 LINES 畏 数 来 循环 遍历 每 一 条 记录 。 

WHILE @I < LINES(@Labels) 

BEGIN 
SET @tdef = @tdef + ', ' + @labels[@I][0] + ' numeric(12,3) '; 
SET @I = @I + 1; 

END 


SET Qtdef = @tdef + ')'; 


打印 表 def。 
PRINT @tdef; 
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创建 表 。 
CREATE TABLE Qtdef; 


尽管 pgScript 中 没有 专门 用 于 执行 动态 SQL 的 命令 ， 但 我 们 可 以 通过 示例 4-1 中 所 示 的 方 
法 来 实现 执行 动态 SQL， 即将 SQL 字符 串 分 配给 某 个 变量 。 我 们 在 下 面 的 示例 4-2 中 更 加 
深入 地 挖掘 了 pgScript 的 功能 ， 该 示例 中 我 们 对 上 面 刚刚 创建 好 的 census.hisp_pop 表 进 
行 了 填充 操作 。 


示例 4-2: 使 用 pgScript 循环 填充 表 


DECLARE @I, @labels, @tload, @tcols, @fact_ types; 
SET QI = 0; 
SET @labels = 
SELECT 
quote_ident( 
repLace( 
repLace( 
lower(COALESCE(fact_subcats[4], fact_subcats[3])), ' '， 





| 




















) As col_name, 
fact_type_id 
FROM census.lu_fact types 
WHERE category = 'Population' AND fact subcats[3] ILIKE 'Hispanic or Latino%' 
ORDER BY short_name; 


SET @tload = 'tract_id'; 
SET @tcols = 'tract id '; 
SET @fact types = '-1'; 


WHILE @I < LINES(@Llabels) 
BEGIN 
SET @tcols = @tcols + ', ' + @labels[@I][0] ; 
SET @tload = @tload + 
', MAX(CASE WHEN fact type id= ' + 
CAST(@labels[@I][1] AS STRING) + 
' THEN val ELSE NULL END)'; 
SET @fact types = @fact types + ', ' + CAST(@labels[@I][1] As STRING); 
SET @I = @I + 1; 
END 


INSERT INTO census.hisp_pop(@tcols) 

SELECT @tload FROM census .facts 

WHERE fact_ type_id IN(@fact types) AND yr=2010 
GROUP BY tract_id; 


从 上 面 的 示例 中 可 以 学 到 的 一 点 是 : 可 以 动态 地 往 一 个 变量 中 一 点 点 加 入 SQL 语句 的 零碎 
部 分 ， 最 终 组 成 一 个 完整 的 SQL 语句 。 





4. 


4 以 图 形 化 方式 解释 执行 计划 





pgAdmin 最 为 人 称道 的 优秀 功能 之 一 就 是 它 能 够 以 图 形 化 方式 展示 语句 执行 计划 。 打 开 
SQL 语句 执行 窗口 ， 编 写 一 个 SQL 语句 ， 然 后 点 击 “ 解 释 查 询 ” 图 标 〈 鳞 ) 就 可 以 看 到 
此 语句 的 执行 计划 图 示 。 


























例如 ， 我 们 执行 以 下 查询 : 


SELECT left(tract_id, 5) As county_code, SUM(hispanic or_latino) As tot， 
SUM(white_alone) As tot_white, 
SUM(COALESCE(hispanic_or_latino,0) - COALESCE(white_alone,0)) AS non_white 
FROM census.hisp_pop 
GROUP BY county_code 
ORDER BY county_code; 





我 们 将 看 到 如 图 4-16 所 示 的 图 形 化 解释 。 读 懂 这 种 图 形 化 解释 有 一 个 小 窑 门 ， 那 就 是 : 尽 


可 外 














Ei 上 粗 第 头 变 细 ! 箭头 越 粗 ， 说 明 该 步骤 执行 时 间 越 长 。 









































4-16: 图 形 化 解释 示例 


如 果 SQL 语句 执行 器 菜单 栏 上 的 Query (查询 ) 一 Explain (解释 ) 一 Buffers (缓冲 区 ) 已 








启 月 





日， 那么 图 形 化 解释 就 会 被 禁用 。 因 此 切记 使 用 图 形 化 解释 时 不 要 启用 该 选项 。 除 了 图 











形 化 解释 之 外 ，Data Output (数据 输出 ) 选项 卡 上 还 会 显示 文本 解释 计划 ， 本 例 中 的 输出 
如 下 所 示 。 


4. 


pgAgent 是 PostgreSQL 中 执行 定时 任务 的 得 力 工具 。 同 时 它 也 可 用 于 执行 操作 系统 批 处 理 





GroupAggregate (cost=111.29..151.93 rows=1478 width=20) 

Output: ("left"((tract id)::text, 5))， sum(hispanic_or_latino), 
sum(white_alone), ... 

-> Sort (cost=111.29..114.98 rows=1478 width=20) 
Output: tract_id, hispanic or_latino, white_alone, 

("left"((tract id)::text, 5)) Sort Key: ("left"((tract_id)::text, 5)) -> 
Seq Scan on census.hisp pop (cost=0.00..33.48 rows=1478 width=20) Output: 
tract_id, hispanic or_latino ,White alone, "left"((tract id)::text, 5) 


5 使 用 pgAgent 执 行 定时 任务 























脚本 ， 因 此 在 Linux/Unix 系统 中 它 可 取代 crontab;， 在 Windows 中 ， 它 可 取代 定时 任务 规 
划 器 。 事 实 上 ，pgAgent 的 定时 任务 功能 远 比 这 里 描述 的 更 强大 : 任何 一 人 台 机 器 ， 不 管 操 
作 系 统 是 什么 ， 只 要 它 上 面 能 安装 pgAgent， 那 么 我 们 就 可 以 在 此 机 器 上 执行 定时 任务 。 
具体 步骤 是 先 在 这 台 机 器 上 装 好 pgAgent， 然 后 设置 该 pgAgent 连接 到 一 个 PostgreSQL 数 
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据 库 上 ， 但 需要 该 数据 库 上 预先 安装 好 pgAgent 所 需 的 功能 表 和 国 数 。 执 行 定 时 任务 的 机 
器 上 不 需要 安装 PostgreSQL 服务 端 软件 ， 但 客户 端 数据 库 是 必须 的 ， 因 为 要 保证 pgAgent 
能 够 连接 到 外 部 的 PostgreSQL 服务 器 。pgAgent 是 构建 于 PostgreSQL 架构 基础 上 的 ， 
此 你 可 以 通过 控制 服务 端的 表 数 据 来 控制 pgAgent 的 行为 。 例 如 ， 如 果 需 要 把 一 个 复杂 的 
定时 任务 复制 多 次 ， 那 么 你 只 需 直 接 登 录 到 PostgreSQL 服务 器 并 往 pgAgent 的 表 中 插入 几 
条 记录 即 可 ， 完 全 不 需要 在 pgAmin 界面 上 对 pgAgent 执行 操作 。 





























本 节 中 我 们 将 教 你 如 何 使 用 pgAgent。 在 “设置 pgAgent 来 执行 定时 备份 ”(http:/www. 
postgresonline.com/journal/archives/19-Setting-up-PgAgent-and-Doing-Scheduled-Backups. 
html) 这 篇 博文 中 你 可 以 看 到 一 个 真正 实用 的 例子 以 及 设置 细 市 。 


4.5.1 安装 pgAgent 

你 可 以 从 http://www.pgadmin.org/download/pgagent.php 这 个 链接 下 载 pgAgent 的 安装 包 。 
在 Windows 上 ， 你 也 可 以 通过 EnterpriseDB 公司 提供 的 Stackbuilder 软件 来 安装 pgAgent。 
安装 包 中 的 SQL 脚本 会 在 postgres 库 中 自动 创建 一 个 名 为 pgAgent 的 新 shema。 然 后 当 
你 通过 pgAdmin 连 到 数据 库 服务 器 时 ， 可 以 在 目录 树 上 看 到 一 个 名 为 Jobs (作业 ) 的 新 节 
点 ， 如 图 4-17 所 示 。 




















国 local (ocalhost:5432) 
由 目 Databases (6) 
由 :上司 ) Tablespaces ( 相 
凡 
Group Roles (0) 
由 -总 Login Roles (2) 











4-17: 安装 了 pgAgent 后 的 pgAdmin 


如 果 你 希望 在 其 他 机 器 上 安装 pgAgent 来 执行 定时 任务 ， 仅 需 在 目标 机 器 上 安装 pgAgent 
客户 端 即 可 ， 而 无 需 再 次 执行 pgAgent 自 带 的 SQL 脚本 ， 因 为 这 个 脚本 只 需 在 PostgreSQL 
服务 端 执行 一 次 即 可 。 请 特别 注意 pgAgent 服务 所 使 用 的 操作 系统 账户 的 权限 设置 ， 一 定 
要 确保 每 个 pgAgent 客户 端 实例 都 有 执行 任务 所 需 的 权限 。 




















即使 批 处 理 任务 能 以 命令 行 方式 执行 成 功 ， 也 并 不 代表 通过 pgAgent 来 
执行 此 任务 就 一 定 会 成 功 。 这 一 般 是 因为 权限 原因 导致 ，pgAgent 总 是 以 
pgAgent 服务 所 使 用 的 操作 系统 账户 的 身份 执行 规划 的 任务 ， 如 果 此 账户 没 
有 足够 权限 来 执行 此 批 处 理 任务 或 者 没有 访问 某 些 必需 路 径 的 权限 ， 那 么 任 
务 就 会 失败 。 





























4.5.2 ”规划 定时 任务 
每 个 定时 任务 包含 两 个 组 成 要 素 : 任务 步 又 以 及 执行 计划 。 当 创建 一 个 新 的 任务 时 ， 先 新 
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增 一 个 或 者 多 个 任务 步骤 。 











图 4-18 是 新 增 / 编辑 任务 步骤 的 界面 。 
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图 4-18: pgAdmin 的 分 步 编 辑 屏幕 








在 每 一 个 任务 步骤 中 ， 你 可 以 设 定 一 条 SQL 语句 或 者 指定 一 个 shell 脚本 作为 任务 内 容 ， 
其 至 可 以 复制 一 整 段 shell 脚本 作为 任务 内 容 。 


如 果 你 选择 了 使 用 SQL 语句 ， 那 么 连接 类 型 选项 会 变 为 可 用 并 且 默 认 值 会 被 设 为 本 地 ， 这 
种 情况 下 该 任务 步骤 中 的 SQL 会 在 pgAgent 服务 端 所 在 的 PostgreSQL 服务 器 上 执行 并 使 
用 pgAgent 运行 时 使 用 的 用 户 名 和 密码 来 进行 身份 验证 。 另 外 还 需要 指定 pgAgent 在 执行 
此 任务 时 要 连 到 的 目标 database。 界 面 上 有 一 个 下 拉 列 表 供 你 选择 具体 的 database。 如 果 你 
选择 了 连接 到 远 端 数据 库 服务 器 ， 
此 框 中 输入 完整 的 连接 字符 串 ， 包 括 用 于 身份 验证 的 信息 以 及 要 连 到 的 目标 database。 如 
果 你 连 到 一 个 早期 版 本 的 远 端 PostgreSQL 数据 库 ， 请 确保 要 执行 的 SQL 语句 的 语法 在 该 
老 版 本 的 PostgreSQL 上 是 支持 的 。 











如 果 你 选择 了 执行 批 处 到 
如 ， 如 果 pgAgent 运行 于 Windows 环境 下 ， 那 么 批 处 到 















































那么 供 输入 连接 字符 串 的 文本 框 会 变 为 可 用 状态 。 





请 在 





任务 ， 那 么 其 语法 必须 符合 执行 此 任务 的 操作 系统 的 要 求 。 例 
任务 脚本 必须 是 合法 的 DOS 命令 


行 脚本 ， 如 果 pgAgent 运行 于 Linux 环境 ， 那 么 批 处 理 任务 脚本 必须 是 合法 的 shell 脚本 。 
多 个 任务 步骤 之 间 是 以 其 名 称 的 字母 顺序 来 排序 并 执行 的 。 你 可 以 指定 每 个 步骤 执行 完毕 
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后 的 处 理 方式 : 如 果 该 步骤 执行 成 功 则 如 何 处 理 ， 如 果 该 步骤 执行 失败 则 如 何 处 理 。 你 可 
以 选择 禁用 某 些 步骤 而 不 删除 它们 ， 因 为 你 以 后 还 可 能 重新 用 上 这 些 步 又 。 














任务 步骤 设 定好 之 后 ， 你 就 可 以 设 定 执行 计划 来 执行 这 些 步骤 了 。 通 过 执行 计划 页 面 你 可 
以 设 定 极为 复杂 的 执行 策略 ， 你 甚至 可 以 设置 多 个 执行 计划 。 








如 果 你 在 多 台 机 器 上 安装 了 pgAgent， 而 这 些 pgAgent 都 连 到 同一 个 pgAgent 服务 端 数 据 
库 ， 那 么 默认 情况 下 所 有 这 些 pgAgent 会 执行 数据 库 中 记录 的 所 有 计划 任务 。 


如 果 你 希望 某 个 计划 任务 只 在 某 台 特定 的 机 器 上 执行 ， 那 么 可 以 在 创建 计划 任务 时 将 页 
而 上 的 host agent (主机 代理 ) 字段 设置 为 希望 执行 此 计划 任务 的 目标 主机 名 。 这 样 其 
他 机 器 上 的 pgAgent 会 发 现 此 计划 任务 的 目标 主机 名 与 自己 所 在 主机 名 不 符 ， 从 而 忽略 


此 任务 。 



































pgAgent 包含 两 部 分 数据 : 定义 任务 的 数据 以 及 任务 执行 日 志 。 这 些 任 务 

日 志 会 记录 在 pgAgent 这 个 schema 中 ， 而 pgAgent schema 一 般 隶 属于 
postgres 数据 库 。pgAgent 进程 会 查询 待 执行 的 任务 信息 以 决定 接 下 来 执行 
什么 任务 ， 然 后 在 执行 过 程 中 把 相关 的 任务 日 志 信息 写 和 数据库 中 。 一 般 来 
说 ， 用 于 承载 这 两 类 数据 的 PostgreSQL 服务 器 和 pgAgent 是 运行 于 同一 台 服 
务 器 上 的 ， 但 并 不 是 必须 如 此 ， 二 者 可 以 分 离 部 署 。 此 外 ， 一 台 PostgreSQL 
服务 器 可 以 服务 于 很 多 部 署 在 不 同 主机 上 的 pgAgent。 

















一 个 完整 的 定时 任务 看 起 来 如 图 4-19 所 示 。 
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4-19: pgAdmin 界面 上 的 pgAgent 定时 任务 











4.5.3 一些 有 用 的 pgAgent 相 关 查 询 语 名 

如 果 你 SQL 技术 高 超 ， 那 么 完全 可 以 通过 直接 修改 pgAgent 的 元 数据 表 来 实现 对 定时 任 
务 的 复制 、 删 除 和 修改 。 只 是 在 修改 时 要 特别 小 心 谨 慎 ， 不 要 搞 错 ! 例如 ， 要 想 查看 控制 
着 pgAgent 和 定时 任务 具体 行为 的 后 台 表 内 容 ， 只 需 连 到 postgres 数据 库 并 执行 以 下 示例 
4 .3 中 的 查询 。 





示例 4-3: 查询 pgAgent 相关 表 的 描述 信息 

SELECT c.relname As table_name, d.description 

FROM 
pg_class As c INNER JOIN 
pg_namespace n ON n.oid = c.relnamespace INNER JOIN 
pg_description As d ON d.objoid = c.oid AND d.objsubid = 0 

WHERE n.nspname = 'pgagent’ 

ORDER BY c.reLname ; 


| description 
-000-0----- 十 ------------------------- 
pga_job | Job main entry 
pga_jobagent | Active job agents 
pga_jobclass | Job classification 
pga_joblog | Job run logs. 
pga_jobstep | Job step to be executed 
pga_jobsteplog | Job step run logs. 
pga_schedule | Job schedule exceptions 





尽管 在 pgAdmin 中 制定 pgAgent 定时 任务 和 观察 其 执行 日 志 的 界面 已 经 非常 直观 易 懂 ， 但 
如 有 果 你 设置 了 很 多 定时 任务 或 者 你 希望 查看 自己 的 定时 任务 执行 结果 总 览 ， 那 么 就 会 非常 
需要 生成 自己 的 定时 任务 执行 报告 。 示 例 4-4 演示 了 我 们 在 此 情况 下 经 常会 使 用 的 一 个 查 
询 语句 。 

















示例 4-4: 列 出 从 今天 开始 的 定时 任务 执行 结果 

SELECT j.jobname, s.jstname, 1l.jslstart,l.jslduration, 1.jsloutput 

FROM 
pgagent.pga_jobsteplog As L INNER JOIN 
pgagent.pga_jobstep As s ON s.jstid = .jsLjstitd INNER JOIN 
pgagent.pga_job As j ON j.jobid = s.jstjobid 

WHERE jsLstart > CURRENT_DATE 

ORDER BY j.jobname, s.jstname, l.jslstart DESC; 


有 时 候 定 时 任务 即使 失败 了 也 会 报 成 功 ， 因 为 pgAgent 并 不 总 能 准确 判断 shell 脚本 的 执行 


结果 到 底 是 成 功 还 是 失败 。 日 志 中 的 jstoutput 字段 提供 shell 输出 ， 该 输出 通常 会 详细 说 
明 哪 里 出 现 了 错误 。 





在 Windows 平台 上 ， 有 若干 个 版 本 的 pgAgent 经 常会 把 事实 上 已 执行 成 功 的 
shell 脚本 的 执行 结果 判定 为 执行 失败 。 如 果 你 遇 到 了 这 种 情况 ， 那 么 应 该 把 
任务 步骤 的 结果 处 理 方式 设 定 为 “错误 时 忽略 "。 这 是 一 个 已 知 的 bug， 我 们 
希望 在 将 来 的 版 本 中 能 够 尽快 修复 。 
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数据 类 型 











与 其 他 所 有 数据 库 一 样 ，PostgreSQL 也 支持 数字 型 、 字 符 串 型 、 日 期 和 时 间 型 以 及 布尔 型 
等 业界 常用 的 数据 类 型 。 但 PostgreSQL 的 先进 之 处 在 于 它 还 支持 数组 、 带 时 区 的 日 期 时 
间 、 时 间 间 隔 、 区 间 、JSON、XML 以 及 其 他 很 多 数据 类 型 ， 此 外 还 支持 用 户 自 定义 数据 
类 型 。 本 章 们 不 会 一 一 介绍 PostgreSQL 支持 的 所 有 数据 类 型 ， 如 果 你 需要 了 解 的 话 ， 请 自 
行 参考 官方 手册 。 我 们 将 着 重 介绍 PostgreSQL 独 有 的 若干 数据 类 型 以 及 在 那些 通用 数据 类 
型 方面 PostgreSQL 与 业界 其 他 数据 库 有 哪些 细微 差异 。 




















如 果 离 开 了 相应 的 函数 和 运算 符 ， 数 据 类 型 将 完全 无 用 武之 地 。PostgreSQL 为 各 种 数据 类 
型 提供 了 功能 强大 种 类 丰富 的 原生 函数 和 运算 符 支 持 ， 而 且 很 多 扩展 包 还 在 源源 不 断 地 提 
供 新 的 扩展 。 我 们 将 在 本 章 中 介绍 一 些 使 用 比较 广泛 的 类 型 。 








我 们 所 说 的 函数 是 指 f(x) 这 种 形式 的 函数 ， 我们 所 说 的 “运算 符 ” 是 指 一 
些 字符 性 的 运算 符号 ， 比 如 +、-、*、/ 这 类 ， 具 体 可 分 为 需要 单个 实 参 的 
一 元 运算 符 和 需要 两 个 实 参 的 二 元 运算 符 。 最 简单 的 运算 符 是 需要 一 个 或 多 
个 实 参 的 函数 的 一 个 符号 别名 ， 比 如 + 这 个 运算 符 可 以 理解 为 add(x,y) 这 个 
函数 的 一 个 符号 别名 。 当 使 用 运算 符 时 ， 请 记 住 它 在 面 对 不 同 的 数据 类 型 时 
所 代表 的 含义 是 不 同 的 。 比 如 加 号 对 数字 来 说 就 是 相 加 ， 对 区 间 类 型 来 说 就 
是 区 间 的 并 集 。 



























































5.1 数值 类 型 
PostgreSQL 支持 常用 的 整数 、 小 数 、 浮 点 数 等 数字 类 型 。 我 们 想 重点 介绍 的 是 serial 类 型 
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以 及 一 个 灵活 实用 的 整数 序列 生成 函数 。 


5.1.1 serial 类 型 

serial 类 型 和 它 的 兄弟 类 型 bigserial 是 两 种 可 以 自动 生成 递增 整数 值 的 数据 类 型 ， 一 般 
如 果 表 本 身 的 字段 不 适宜 作为 主键 字段 时 ， 会 增加 一 个 专门 的 字段 并 指定 为 serial 类 型 
以 作为 主键 。 在 不 同 的 数据 库 产品 中 这 种 数据 类 型 有 着 不 同 的 称呼 ， 一 般 最 常见 的 叫 法 是 
autonumber。 建 表 时 如 果 指 定 了 一 个 字段 类 型 为 serial， 那 么 PostgreSQL 会 首先 将 其 作为 
整 型 处 理 ， 同 时 自动 在 该 表 所 在 schema 中 创建 一 个 名 为 table_name_column_name_seq 的 序 
列 。 然 后 设 定 该 序列 为 该 整 型 字段 的 取 值 来 源 。 如 果 修 改 了 表 定 义 并 删除 此 serial 字段 ， 
那么 系统 同时 也 会 自动 删除 掉 附 属 的 序列 。 


在 PostgreSQL 中 ， 序 列 自身 就 是 一 种 数据 库 资 产 。 你 可 以 通过 pgAdmin 图 形 界面 或 者 
ALTER SEQUENCE 语句 来 管理 该 类 对 象 。 你 可 以 设置 其 当前 值 和 边界 值 (也 就 是 最 大 和 最 小 
值 )， 还 可 以 设置 每 次 递增 的 步 长 。 虽 然 一 般 来 说 序列 值 都 是 递增 的 ， 但 你 也 可 以 将 其 设 
为 递减 ， 只 要 将 步 长 值 increment 设 为 负数 即 可 。 作 为 一 种 独立 的 数据 库 资 产 ， 你 可 以 通 
过 CREATE SEQUENCE 命令 来 创建 序列 ， 还 可 以 在 多 张 表 间 共 用 同一 个 序列 。 如 果 你 需要 生 
成 一 个 跨越 多 表 的 唯一 键 值 ， 那 么 这 种 多 表 共 享 序列 的 用 法 是 特别 方便 的 。 


要 实现 多 表 共 用 同一 个 序列 ， 请 先 将 字段 定义 为 integer 或 者 bigint 类 型 ， 然 后 指定 其 默 
认 值 为 nextval(sequence_name) 即 可 。 

































































如 果 你 重 命 名 了 一 张 含 serial 字段 的 表 ， 这 张 表 的 serial 字段 关联 的 序列 
是 不 会 跟着 改名 的 ， 但 关联 运作 机 制 是 不 受 影响 的 。 如 果 你 特别 重视 对 象 名 
的 一 致 性 ， 可 以 手动 修改 序列 的 名 称 以 保持 与 表 名 一 致 。 


5.1.2 ”生成 数组 序列 的 函数 

PostgreSQL 有 一 个 名 为 generate_series 的 灵活 又 实用 的 数组 生成 国 数 ， 目 前 为 止 我 们 还 
没 发 现 有 哪 种 数据 库 支 持 类 似 功 能 。generate_series 国 数 的 方便 之 处 在 于 你 可 以 使 用 它 有 
效 地 模仿 SQL 中 的 for 循环 。 假 设 我 们 需要 得 到 一 个 列表 ， 该 列表 中 包含 了 特定 日 期 区 间 
内 每 个 月 份 最 后 一 天 的 日 期 。 如 果 不 借助 generate_series 国 数 ， 要 实现 此 功能 要 么 写 一 
个 内 部 使 用 循环 的 函数 ， 要 么 生成 一 个 基于 日 期 类 型 的 笛 卡 儿 积 然后 逐条 筛选 。 如 果 使 用 
了 generate_series 国 数 ， 那 么 仅 需 一 行 SQL 即 可 。 我 们 会 在 后 续 的 示例 5-11 中 展示 具体 
做 法 。 


示例 5-1 使 用 可 选 的 步 长 形 参 来 生成 整数 序列 。 





示例 5-1: 使 用 generate_series() 函数 生成 步 长 为 13 的 整数 序列 


SELECT x FROM generate_series(1,51,13) As x; 
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如 上 面 的 示例 5-1 所 示 ， 你 可 以 传人 一 个 可 选 的 步 长 实 参 来 指定 对 于 每 个 后 续 元 素 要 跳 过 
多 少 个 步 长 。 如 果 不 指 定 ， 则 默认 为 1。 另 外 请 注意 : 结束 值 将 永远 不 会 超出 我 们 指定 的 
区 间 ， 因 此 ， 尽 管 我 们 的 区 间 结 束 于 51， 但 我 们 的 最 后 一 个 数字 是 40， 因 为 40 再 加 上 13 
就 会 超出 上 限 。 


5.2 ”字符 和 字符 串 


PostgreSQL 有 三 种 最 基础 的 数据 类 型 : character (也 称 为 char)、character varying (也 
称 为 varchar) 和 text。varchar 和 text 适用 于 存储 长 度 可 变化 的 文本 ， 每 一 行 记录 需要 
多 大 空间 就 分 配 多 大 空间 。 这 两 种 类 型 的 存储 方式 是 完全 一 致 的 ， 性 能 表现 也 设 有 差别 。 























char 类 型 占用 的 存储 空间 是 固定 的 ， 适 用 于 如 邮政 编码 、 电 话 号 码 以 及 社会 保险 号 等 定 长 
字符 串 的 存储 。 如 果 存 储 的 字符 长 度 达 不 到 char 类 型 的 定义 长 度 ， 那 么 会 在 后 面 用 空格 
填充 ， 不 管 存 储 时 还 是 查询 显示 时 都 是 这 样 。 这 种 模式 对 于 存储 空间 有 所 浪费 ， 但 这 也 是 
ANSI SQL 标准 中 规定 的 做 法 。 除 此 以 外 ， 在 PostgreSQL 中 char 和 varchar 没有 别 的 性 能 
差别 。 


没有 大 小 修饰 符 的 varchar 与 text 之 间 几 乎 没什么 差别 。 对 于 text 列 来 说 ,不 管 它 所 包 
含 的 字符 有 和 多少， 你 都 可 以 对 其 进行 排序 。 有 些 数 据 库 驱 动 程序 (比如 ODBC) 可 能 会 对 
二 者 的 处 理 略 有 差别 。varchar 和 text 的 存储 空间 上 限 均 为 约 1 GB， 但 事实 上 系统 在 后 台 
会 把 超过 一 个 物理 存储 页 大 小 的 内 容 用 TOAST 机 制 处 理 。 

















在 PostgreSQL 9.2 版 之 前 ， 如 果 你 需要 加 大 一 个 varchar 字段 的 长 度 定义 而 
此 时 该 表 中 已 有 记录 存在 ， 那 么 系统 实际 上 会 在 后 台 建 一 张 新 表 再 把 数据 从 
旧 表 转移 到 新 表 ， 访 过程 会 耗费 一 定时 间 并 会 导致 锁 表 。 因 此 ， 大 家 一 般 会 
通过 使 用 text 类 型 来 避免 此 问题 。 

















关于 是 否 应 该 彻底 废弃 varchar 并 完全 转 用 text 这 个 问题 ， 业 界 一 直 有 着 不 同 的 声音 。 
我 们 不 会 在 此 处 浪费 篇 幅 和 争论 此 问题 ， 请 你 参考 “我 为 varchar(x) 的 辩护 ”这 篇 博文 
(http://www.postgresonline.com/journal/archives/154-In-Defense-of-varcharx.html) 以 了 解 这 
场 争论 的 详情 。 


有 时候， 为 了 保持 跨 平台 应 用 的 兼容 性 ， 你 需要 使 字符 串 类 型 的 操作 变 得 不 区 分 大 小 写 。 
要 实现 此 目标 ,你 需要 重 写 那 些 区 分 大 小 写 的 比较 运算 符 。 相 比 text， 对 varchar 进行 
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运算 符 重 写 要 更 容易 一 些 。 我 们 在 “将 MS Access 与 PostgreSQL 协同 使 用 ”这 篇 博文 中 
(http://www.postgresonline.com/journal/archives/24-Using-MS-Access-with-PostgreSQL.htm!l) 
演示 了 如 何 使 varchar 类 型 变 得 不 区 分 大 小 写 而 且 同 时 还 能 够 用 上 索引 。 


5.2.1 字符 串 函 数 

常见 的 字符 串 操 作 包括 ;填充 (Lpad、rpad)、 修 整 空白 (rtrin、ttrin、trin、btrim)、 
提取 子 字符 串 (substring) 以 及 连接 (11)。 示 例 5-2 演示 了 填充 操作 ， 示 例 5-3 演示 了 修 
整 空白 操作 。 











示例 5-2: 使 用 Lpad 和 rpad 进行 填充 操作 


SELECT lpad('ab', 4, '0') As ab_lpad, rpad('ab', 4, '0') As ab_rpad，Lpad('abcde ' ， 
4, '0') As ab_lpad_ trunc; © 


ab_Lpad | ab_rpad | ab_lpad_trunc 
Pp ee ee 
00ab | ab00 | abcd 








@ 如 果 字 符 串 超过 指定 长 度 的 话 ，Lpad 不 但 不 会 填充 ， 反 而 会 对 其 进行 截断 。 





默认 情况 下 ，trim 函数 用 于 移 除 空格 ， 但 你 也 可 以 传人 一 个 可 选 实 参 指示 要 剪裁 的 其 他 
字符 。 


示例 5-3: 剪裁 空格 和 字符 
SELECT 
a As a_before, trim(a) As a_trim, rtrim(a) As a_rt， 
i As i before, ltrim(i, '0') As i_ lt 0， 
rtrim(i, '0') As i rt 0, trim(i, '0') As i t 0 


FROM ( SELECT repeat(' ', 4) || i || repeat(' ', 4) As a, '0' || i As i FROM gener 
ate_series(0, 200, 50) As i 
) As x; 
a_before | atrim | art | i before |ii lto|irto|ito 
------------- +--------+---------+----------+--------+--------+------- 

0 | 9 | 0 | 900 | | | 

50 | 50 | 50 | 050 | 50 | 65 | 5 

100 | 100 | 100 | 0100 | 100 | 01 |1 

150 | 150 | 150 | 0150 | 150 | 9015 | 15 

200 | 200 | 200 | 0200 | 200 | 02 | 2 





从 PostgreSQL 9.0 版 开始 支持 一 种 很 有 用 的 字符 串 操 作 函 数 string_agg， 我 们 已 在 示例 
3-11 中 展示 了 其 用 法 ， 你 还 将 在 示例 5-21 中 再 次 见 到 它 。 该 函数 与 MySQL 的 group_ 
concat 函数 作用 是 相同 的 。 


5.2.2 ”将 字符 串 拆 分 为 数组 、 表 或 者 子 字符 串 


PostgreSQL 中 有 一 些 国 数 可 以 对 字符 串 进行 拆 分 操作 。 
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split_part 国 数 可 以 将 指定 位 置 的 元 素 从 用 固定 分 隔 符 分 隔 的 字符 串 中 取出 来 ， 如 示例 
5-4 所 示 。 
示例 5-4: 取出 分 隔 符 字符 串 中 的 第 个 元 素 


SELECT split_part('abc.123.z45', '.', 2) As Xx; 





string_to_array 国 数 可 以 将 基于 固定 分 隔 符 的 字符 串 拆 分 为 一 个 数组 。 通 过 将 string_ 
to_array 和 unnest 函数 结合 使 用 ， 你 可 以 将 一 个 字符 串 展开 为 若干 记录 行 ， 如 示例 5-5 
所 示 。 

示例 5-5: 将 基于 固定 分 隔 符 格式 的 字符 串 展开 为 记录 行 


SELECT unnest(string_to_array('abc.123.z45', '.')) As x; 





5.2.3 正则 表达 式 和 模式 匹配 

PostgreSQL 对 正则 表达 式 的 支持 是 极其 强大 的 。 你 可 以 设 定 查询 返回 结果 的 格式 为 表 或 
者 数组 ， 并 且 对 其 进行 极其 复杂 的 替换 和 更 新 操作 。 包 括 逆向 引用 (back reference) 在 内 
的 一 些 高 级 搜索 方法 都 是 支持 的 。 在 本 市 中 ， 我 们 将 提供 一 个 小 型 的 示例 以 说 明 这 些 内 
容 。 如 需 了 解 更 多 相关 信息 ， 请 参考 PostgreSQL 官方 手册 中 的 “模式 匹配 ” (http://www. 
postgresql.org/docs/current/interactive/functions-matching.html) 和 “字符 串 函 数 ”(http:// 























www.postgresql.org/docs/current/interactive/functions-string.html) 这 两 节 的 内 容 。 








示例 5-6 展示 了 如 何 对 以 数字 形式 存储 的 电话 号 码 进行 格式 化 操作 。 
示例 5-6: 使 用 逆向 引用 技术 对 电话 号 码 进 行 重新 格式 化 


SELECT regexp_repLace( 
"6197306254 ' ， 
[90-9]{3})([0-9]{3})([9-9]{4}) ， 
E'\(\A1IN\) \\2-\\3， 

) As x; 


(619) 730-6254 





\\1 和 \\2 是 模式 匹配 表达 式 中 的 元 素 。 我 们 使 用 反 斜 枉 (\) 来 转 义 圆 括 号 ， 表 示 此 处 是 
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真 的 要 作为 一 个 圆 括号 来 用 。E' 是 PostgreSQL 的 构造 符 语 法 ， 表 示 后 续 跟 着 的 字符 串 是 
一 个 表达 式 ， 其 中 类 似 \ 的 特殊 字符 应 该 按照 字面 含义 来 处 理 。 











假设 一 个 字符 串 中 内 舱 了 一 些 电 话 号 码 ， 示 例 5-7 演示 了 如 何 仅 通 过 一 个 SQL 语句 就 将 这 
些 号 码 提 取出 来 并 作为 记录 行 输出 : 


示例 5-7: 将 文本 中 的 电话 号 码 作 为 单独 的 行 返 回 
SELECT unnest(regexp_matches( 'Cell (619)852-5083. Casa 619-730-6254. Bésame mucho. 


E'[(]{0,1}[0-9]{3}[)-.]{0,1}[0-9]{3}[-.]{0,1}[0-9]{4}', 'g') 
) As x; 








(619)852-5083 
619-730-6254 


示例 5-7 中 用 到 的 匹配 规则 如 下 所 示 。 


。 [(]{9,1}: 开始 是 0 个 或 者 1 个 (。 

。 [9-9]{3}: 跟着 3 位 数字 。 

。 [)-.]{0,1}: 跟着 0 个 或 者 1 个 ) 或 者 - 或 者 .。 

。 [9-9]{4}: 跟着 4 位 数字 。 

。 regexp_matches 函数 会 返回 根据 一 个 正则 表达 式 筛选 匹配 得 到 的 字符 串 数组 。 如 果 不 传 
入 g 形 参 ， 则 仅 返 回 第 一 个 命中 的 字符 串 。9 表示 global， 即 需要 进行 完整 搜索 并 返回 
所 有 匹配 上 的 字符 串 ， 每 个 字符 串 作 为 数组 中 的 一 个 元 素 。 

。 unnest 函数 将 一 个 数组 分 解 为 一 个 行 集 。 














同一 个 正则 表达 式 可 以 有 多 种 写法 。 比 如 ，\\d 代表 [9-9]。 但 我 们 建议 不 
要 为 了 省 那儿 个 字符 而 把 表达 式 搞 得 太 星 淮 难 懂 ， 应 该 采用 更 加 容易 理解 的 
写法 。 











除了 正则 表达 式 专用 的 那些 函数 外 ， 你 还 可 以 将 正则 表达 式 与 SIMILAR T0 (~) 运算 符 一 
起 使 用 。 以 下 查询 可 以 查 出 所 有 内 和 骨 了 电话 号 码 的 字符 串 : 
SELECT description 


FROM mytable 
WHERE description ~ E'[(]{0,1}[0-9]{3}[)-.]{0,1}[0-9]{3}[-.]{0,1}[0-9]{4}'; 


5.3 时间 类 型 
PostgreSQL 对 时 间 类 型 的 支持 在 业界 是 无 人 能 及 的 。 除 了 常见 的 日 期 和 时 间 类 型 ， 
PostgreSQL 还 支持 时 区 ， 并 能 够 按照 不 同 的 时 区 对 夏令 时 进行 自动 转换 。 此 外 PostgreSQL 
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还 支持 一 些 特 殊 的 数据 类 型 ， 如 intervaL， 该 类 型 可 以 用 于 对 日 期 时 间 进 行 数 学 运算 。 
PostgreSQL 还 有 正 无 穷 大 和 和 负 无 穷 大 的 概念 ， 这 样 我 们 就 不 用 为 了 表达 这 两 个 概念 而 弄 
出 一 些 奇 奇怪 怪 的 湾 规 则 ， 搞 这 些 入 规则 迟早 会 导致 问题 。 最 后 ，9.2 版 引入 了 对 区 间 
(range) 类 型 的 支持 ， 该 类 型 可 以 表达 时 间 区 间 的 概念 ， 并 且 提 供 了 大 量 与 区 间 运 算 相 关 
的 运算 符 、 函 数 和 索引 。 我 们 会 在 本 章 后 续 的 5.5 节 中 详细 介绍 该 类 型 。 


在 最 新 的 版 本 中 ，PostgreSQL 支持 9 种 时 间 相关 的 数据 类 型 。 理 解 这 些 类 型 之 间 的 区 别 很 
重要 ， 否 则 你 就 无 法 为 不 同业 务 场景 选择 适用 的 数据 类 型 。 除 了 range 类 型 外 ， 其 他 所 有 
类 型 都 遵循 ANSI SQL 标准 。 业 界 的 其 他 数据 库 最 多 支持 这 些 类 型 中 的 一 部 分 而 非 所 有 。 
Oracle 支持 的 类 型 最 多 ，SQL Server 其 次 ，MySQL 又 次 之 ，MySQL 的 任何 版 本 都 不 支持 



















































































时 区 类 型 。 

PostgreSQL 的 每 种 时 间 类 型 都 有 其 独特 之 处 ， 因 此 我 们 接 下 来 对 其 分 别 做 一 些 更 详细 的 
介绍 。 

。 date 


该 类 型 仅 存 储 月 、 日 、 年 ， 没 有 时 区 、 小 时 、 分 和 秒 的 信息 。 


time (又 称 time without time zone) 


该 类 型 仅 存 储 小 时 、 分 、 秒 信息 ， 不 带 日 期 和 时 区 信息 。 





timestamp (又 称 timestamp without time zone) 

该 类 型 存储 了 日 期 (年 、 月 、 日 ) 和 时 间 (时 、 分 、 秒 ) 数据 ， 但 不 带 时 区 信息 。 
此 ， 即 使 你 修改 了 数据 库 服 务 器 所 在 的 时 区 信息 ， 该 类 字段 查询 出 来 显示 的 值 也 是 固定 
不 变 的 。 





i 


























timestamptz (又 称 timestamp with time zone) 

该 类 型 同时 存储 了 日 期 、 时 间 以 及 时 区 信息 。 在 系统 内 部 ， 该 类 型 的 字段 值 是 以 UTC 
世界 标准 时 间 格 式 存储 的 ， 但 当 查 询 显 示 时 ， 会 按照 服务 器 的 时 区 设置 进行 换算 后 再 显 
示 (时 区 也 可 以 在 库 级 / 用 户 级 /会 话 级 分 别 进行 设置 )。 如 果 你 输入 的 时 间 惟 不 带 时 区 
数据 ， 那 么 存 入 timestamptz 类 型 字段 中 时 ，PostgreSQL 会 自动 使 用 当前 数据 库 服务 器 
的 时 区 信息 来 补充 。 如 果 修 改 了 数据 库 服务 器 的 时 区 设置 ， 你 可 以 看 到 查询 出 来 的 时 间 
数据 发 生 了 变化 。 















































timetz (又 称 time with time zone) 

与 timestamptz 类 型 类 似 ， 但 该 类 型 的 使 用 频率 较 低 ， 因 为 它 虽 然 携 带 了 时 区 信息 但 却 
没有 日 期 信息 。 该 类 型 永远 假设 当前 时 间 是 夏令 时 。 有 的 编程 语言 不 支持 这 种 仅 有 了 时间 
而 无 日 期 的 数据 类 型 ， 因 此 可 能 会 将 其 自动 转换 为 带 时 区 的 时 间 惟 类 型 ， 转 换 时 日 期 就 
取 计 算 机 系统 时 间 的 初始 值 (例如 ，Unix 时 间 纪 元 起 始 于 1970 年 ， 因 此 转换 后 的 日 期 
就 是 1970 年 1 月 1 日 ,时 区 和 时 间 不 变 ， 夏 令 时 )。 




















。 interval 
该 类 型 描述 了 一 个 时 间 段 的 长 度 ， 单 位 可 以 是 小 时 、 天 、 月 、 分 钟 或 者 其 他 粒度 。 该 类 
型 适用 于 对 日 期 和 时 间 进 行 数学 运算 的 场景 。 例 如 ， 假设 从 现在 开始 666 天 之 后 世界 就 
会 灭亡 ， 那 么 你 可 以 在 现在 的 时 刻 上 加 上 长 度 为 666 天 的 一 个 interval 类 型 值 就 可 以 
知道 世界 灭亡 的 准确 时 刻 。 





























。 tsrange 
该 类 型 是 9.2 版 新 引入 的 ， 可 用 于 定义 timestamp with no timezone 的 开 区 间 和 闭 区 间 。 
该 类 型 包含 两 个 时 间 惟 以 及 开 区 间 和 闲 区 间 限 定 符 。 例 如 ，"'[2612-01-91 14:06 2012- 
91-91 15:00) ::tsrange 定义 了 从 14:00 开始 到 15:00 之 前 结束 的 一 个 时 间 段 。 请 参 
考 PostgreSQL 官方 手册 中 “区 间 类 型 ”这 一 节 (http:/www.postgresql.org/docs/current/ 
static/rangetypes.html#RANGETYPES-BUILTIN) 以 了 解 更 多 信息 。 














。 tstzrange 


该 类 型 也 是 9.2 版 新 引入 的 ， 可 用 于 定义 timestamp with timezone 的 开 区 间 和 闭 区 间 。 





。 daterange 


该 类 型 也 是 9.2 版 引入 的 ， 可 用 于 定义 日 期 的 开 区 间 和 闭 区 间 。 





5.3.1 时 区 详解 

PostgreSQL 中 有 众多 支持 时 区 的 数据 类 型 ， 关 于 它们 有 一 个 常见 的 误解 ， 就 是 认为 
PostgreSQL 会 在 日 期 和 时 间 类 型 的 基础 上 额外 增加 一 个 标记 来 标识 时 区 ， 这 种 理解 是 错误 
的 。 如 果 你 存储 了 这 么 一 个 带 时 区 的 信息 : 2012-2-14 18:08:00-8 (-8 代表 比 UTC 时 间 述 
8 小 时 的 时 区 ) ，PostgreSQL 内 部 其 实 是 这 么 工作 的 。 























(通过 计算 得 到 2012-02-14 18:08:00-8 代表 的 UTC 标准 时 间 ， 就 是 2012-02-15 
04:08:00-0。 
(2) 把 上 述 计 算得 到 的 UTC 标准 时 间 存 储 下 来 。 


当 你 回调 该 数据 以 用 于 显示 时 ，PostgreSQL 内 部 是 这 样 运作 的 : 


(1) 找到 服务 器 所 观察 到 的 时 区 或 者 请 求 的 时 区 (例如 America/New_York)。 

(2) 计算 该 时 区 相对 于 UTC 标准 时 间 的 时 差 (对 于 America/New_York 时 区 来 说 ， 与 UTC 
的 时 差 是 -5 小 时 )。 

(3) 根据 UTC 标准 时 间 和 时 区 的 时 差 计 算出 当地 时 间 (2012-02-15 16:08:00 加 上 时 差 -5 小 
时 后 得 到 2012-02- 15 21:08:00) 。 

(4) 显示 计算 结果 (2012-02- 15 21:08:00) 。 
































可 以 看 到 ，PostgreSQL 并 设 有 存储 时 区 信息 而 仅 是 使 用 时 区 信息 来 把 日 期 和 时 间 转 换 为 
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UTC 标准 时 间 再 存储 下 来 。 此 后 时 区 信息 就 丢失 了 。 当 PostgreSQL 需要 显示 该 日 期 时 间 
信息 时 ， 它 会 按 顺序 查找 当前 会 话 级 、 用 户 级 、 数 据 库 级 、 服 务 器 级 的 时 区 设置 ， 然 后 使 
用 找到 的 第 一 个 时 区 来 将 UTC 标准 时 间 转 换 为 对 应 时 区 的 时 间 值 后 再 显示 。 如 有 果 你 使 用 
了 带 时 区 信息 的 数据 类 型 ， 请 务必 要 了 解 将 服务 器 从 一 个 时 区 搬迁 到 另 一 个 时 区 后 将 会 发 
生 的 后 果 。 假 设 你 的 数据 库 服务 器 起 初 在 纽约 ， 然 后 将 其 数据 拿 到 洛杉矶 做 了 恢复 ， 那 么 
所 有 带 时 区 信息 的 日 期 和 时 间 数 据 看 起 来 都 会 不 一 样 了 。 这 初 看 起 来 有 点 怪 ， 但 其 实 是 正 
常 的， 你 务必 要 预见 到 这 种 情况 的 发 生 。 























以 下 我 们 将 向 你 演示 一 个 时 区 处 理 不 当 导 致 出 问题 的 例子 。 假 设 麦当劳 公司 的 服务 器 都 部 
团 在 东海 岸 ， 服 务 器 中 记录 了 各 门店 的 开门 营业 时 间 ， 并 且 是 用 timetz 格式 存储 的 。 然 后 
在 旧金山 开 了 一 家 新 的 麦当劳 分 店 ， 分 店 的 经 理 给 麦当劳 总 部 打 电 话 ， 告 知 他 们 要 求 把 新 
店 的 信息 纳入 总 部 的 管理 数据 库 ， 并 标记 其 开门 营业 时 间 为 上 午 7 点 。 于 是 位 于 东海 岸 的 
数据 库 服务 器 中 会 记录 下 分 店 的 营业 时 间 为 上 午 7 点， 但 这 个 时 间 转 换 到 旧金山 当地 时 区 
却 是 凌晨 4 点 。 于 是 旧金山 很 多 早起 的 人 们 就 会 很 奇怪 为 什么 明明 说 好 了 是 凌晨 4 点 开门 
却 到 了 时 间 还 没 营 业 。 买 不 到 早点 是 小 事 ， 但 你 可 以 想象 这 三 小 时 的 时 差 能 导致 多 么 大 的 
混乱 ， 这 其 至 可 能 导致 人 命 关 天 的 问题 。 





蕊 












































看 了 上 面 的 例子 ， 你 可 能 会 癌 : 既然 这 么 危险 ， 那 么 为 什么 还 要 使 用 带 时 区 的 时 间 类 型 ? 
原因 有 以 下 几 个 : 首先 ， 这 些 类 型 能 够 自动 执行 时 区 转换 ， 从 而 避免 了 繁琐 的 手工 艺 动 。 
例如 ， 某 航空 公司 的 某 个 航班 上 午 8 点 从 波士顿 出 发 ， 上 午 11 点 到 达 洛 杉 矶 ， 但 是 该 公 
司 的 数据 库 服务 器 位 于 欧洲 ， 如 果 这 些 时 间 入 库 时 都 要 手工 计算 时 差 后 再 录入 那 就 效率 太 
低 了 。 使 用 了 支持 时 区 的 数据 类 型 后 只 需要 录入 带 时 区 信息 的 波士顿 和 次 杉 矶 本 地 时 间 即 
可 ; 另 一 个 使 用 带 时 区 的 数据 类 型 的 理由 是 其 自动 处 理 夏 令 时 的 能 力 。 世 界 各 国 对 于 夏令 
时 的 规定 五 花 八 门 ， 如 果 革 个 数据 库 可 能 会 被 全 球 各 地 的 应 用 访问 ， 那 么 就 需要 及 时 按照 
最 新 的 全 球 夏 令 时 规定 来 更 新 库 中 的 时 间 信息 。 手 工 跟踪 全 球 夏 令 时 的 变化 是 一 件 无 比 系 
琐 的 工作 ， 这 需要 一 个 全 职 的 程序 员 专 门 来 收集 各 国 的 夏令 时 安排 ， 并 在 前 述 数据 库 中 刷 
新 这 些 国家 (包括 其 海外 飞 地 ) 的 相关 时 间 数 据 。 


这 里 有 一 个 非常 有 趣 的 例子 : 一 位 出 差 中 的 销售 员 需 要 坐 飞机 回 家 ， 起 点 是 旧金山 ， 终 点 
是 奥克兰 附近 。 当 她 登 上 飞机 时 ， 当 地 时 钟 显示 的 时 间 是 2012 年 3 月 11 日 凌晨 1 点 50 
分 。 当 她 降落 时 ， 当 地 时 钟 显 示 时 间 是 2012 年 3 月 11 日 凌晨 3 点 10 分 。 那 么 请 癌 这 段 
旅程 共 花 了 多 长 时 间 ? 要 回 到 这 个 问题 有 一 个 关键 点 ， 那 就 是 在 这 段 飞行 的 过 程 中 发 生 了 
夏令 时 的 转换 ， 也 就 是 说 时 间 向 前 跃迁 了 。 如 果 使 用 了 带 时 区 信息 的 时 间 惟 ， 算 出 来 的 时 
间 间 隔 就 是 20 分 钟 ， 对 于 一 段 仅仅 跨越 旧金山 海盗 的 短途 飞行 来 说 ， 这 个 答案 显然 是 可 
信 的 。 如 果 我 们 不 使 用 带 时 区 信息 的 数据 类 型 ， 一 定 会 得 到 错误 的 答案 。 
























































































































































SELECT "2012-03-11 3:10 AM America/Los_AngeLes ' : :timestamptz 
- '2012-03-11 1:50 AM America/Los_Angeles'::timestamptz; 


以 上 查询 得 到 的 答案 是 20 分 钟 ， 然 而 以 下 查询 得 到 的 答案 却 是 1 小 时 20 分 钟 。 
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SELECT '2012-03-11 3:10 AM' : :timestamp- '2012-03-11 1:50 AM'::timestamp; 


我 们 再 举 几 个 例子 来 把 这 个 问题 讲 得 更 透彻 一 些 。 如 示例 5-8 所 示 ， 我 输入 时 使 用 的 是 带 
时 区 的 洛杉矶 本 地 时 间 ， 但 由 于 数据 库 服 务 器 位 于 波士顿 ， 所 以 查询 时 输出 的 时 间 是 带 时 
区 信息 的 波士顿 本 地 时 间 。 请 注意 ， 输 出 显示 附带 了 时 差 ， 这 是 没 问题 的 ， 与 我 原始 录入 
的 时 间 之 间 仅 仅 是 显示 差异 而 已 ， 在 数据 库 系 统 内 部 是 以 UTC 标准 时 间 存储 的 。 


示例 5-8: 输入 时 使 用 的 是 一 个 时 区 的 本 地 时 间 ， 输 出 却 是 另 一 个 时 区 的 本 地 时 间 


SELECT '2012-02-28 10:00 PM America/Los_Angeles'::timestamptz; 














x 








2012-02-29 01:00:00-05 


























在 示例 5-9 中 ， 我 们 要 求 返回 的 是 不 带 时 区 的 时 间 改 。 因 此 这 个 查询 在 全 世界 任何 地 方 的 
数据 库 服务 器 上 执行 都 会 返回 相同 的 结果 。 


示例 5-9: 将 带 时 区 信息 的 时 间 惟 数据 转换 为 不 带 时 区 的 时 间 发 数据 
SELECT '2012-02-28 10:00 PM America/Los_Angeles'::timestamptz AT TIME ZONE "Europe/ 
Paris'; 





2012-02-29 07:00:00 


以 上 查询 其 实 回答 了 这 么 一 个 问题 ; 洛杉矶 本 地 时 间 2012-02-28 10:00 p.m. 对 巴黎 来 说 是 
当地 时 间 几 点 ? 请 注意 查询 结果 是 不 带 相 对 于 UTC 标准 时 间 的 时 差 的 。 另 外 请 注意 可 以 
通过 官方 名 称 而 非 UTC 时 差 来 指定 一 个 时 区 ， 可 以 访问 维基 百科 来 查看 所 有 时 区 的 官方 
名 称 (http://en.wikipedia.org/wiki/Tz_database)。 














5.3.2 ”日 期 时 间 类 型 的 运算 符 和 函数 

时 间 间 隔 类 型 (intervaL) 的 引入 极 大 简化 了 PostgreSQL 中 日 期 和 时 间 类 型 的 数学 运算 过 
程 。 如 果 疫 有 interval 类 型 ， 我 们 就 得 创建 一 堆 专门 的 国 数 来 实现 这 些 运算 功能 ， 很 多 其 
他 数据 库 就 是 这 么 干 的 。 通 过 interval 类 型 ， 我 们 可 以 使 用 我 们 很 熟悉 的 加 减 运 算 符 对 日 
期 和 时 间 进 行进 行 相 加 或 者 相 减 操作 。 下 面 的 例子 展示 了 可 用 于 日 期 和 时 间 类 型 的 运算 符 
和 国 数 。 


+ 运算 符 可 以 在 一 个 时 间 类 型 值 上 加 上 一 段 时 间 间 隔 : 








SELECT '2012-02-10 11:00 PM'::timestamp + interval '1 hour ; 
2012-02-11 00:00:00 

你 也 可 以 将 两 个 interval 类 型 直接 相 加 ; 
SELECT '23 hours 20 minutes'::interval + '1 hour'::interval; 


24:20:00 
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- 运算 符 可 以 从 一 个 时 间 类 型 值 中 减 去 一 段 时 间 间 隔 : 
SELECT '2012-02-10 11:00 PM'::timestamptz - interval '1 hour ; 


2012-02-10 22:00:00-05 




















示例 5-10 中 展示 了 区 间 重 全 运算 符 OVERLAPS 的 用 法 ， 如 果 两 个 参与 运算 的 时 间 段 有 重 倒 ， 
那么 判定 结果 就 是 true。 这 是 ANSI SQL 标准 中 规定 的 运算 符 ， 其 效果 等 价 于 overlaps 函 
数 。0VERLAPS 运算 符 需 要 四 个 形 参 ， 前 两 个 是 第 一 个 时 间 段 的 首尾 时 间 点 ， 后 两 个 是 第 二 
个 时 间 段 的 首尾 时 间 点 。0VERLAPS 运算 符 会 将 这 两 个 时 间 段 看 作 是 半 开 半 闲 区 间 ， 也 就 是 
说 起 始 时 点 包含 在 时 段 内 ， 结 束 时 点 不 包含 在 时 段 内 。 这 与 BETWEEN 运算 符 的 逻辑 是 不 一 
样 的 ，BETWEEN 会 认为 起 始点 和 结束 点 都 是 包含 在 区 间 内 的 。 只 要 你 设置 的 时 间 段 的 起 始 
时 点 和 结束 时 点 不 相同 〈 如 果 相 同 的 话 就 意味 着 时 间 段 长 度 为 0， 也 就 说 时 间 段 变 成 了 一 
个 时 间 点 ) ， 这 个 差异 不 会 造成 什么 问题 。 如 果 你 经 常 需要 使 用 OVERLAPS 运算 符 ， 请 务必 
注意 这 一 点 。 





























示例 5-10: 对 时 间 戳 和 日 期 类 型 使 用 OVERLAPS 运算 符 


SELECT ('2012-10-25 10:00 AM'::timestamp, '2012-10-25 2:00 PM'::timestamp) OVERLAPS 
('2012-10-25 11:00 AM'::timestamp,'2012-10-26 2:00 PM'::timestamp) AS x, 
('2012-10-25'::date,'2012-10-26'::date) OVERLAPS 
('2012-10-26'::date,'2012-10-27'::date) As y; 





除了 运算 符 以 外 ，PostgreSQL 还 支持 一 些 时 间 类 型 的 国 数 。 你 可 以 从 PostgreSQL 官 
方 手 册 的 “日 期 和 时 间 类 型 的 相关 国 数 和 操作 ”(http:Wwww.postgresql.org/docs/current/ 
interactive/functions-datetime.html) 这 一 市 内 容 中 查 到 完整 的 函数 列表 ， 我 们 在 此 仅 演 示 一 
个 例子 。 








我 们 再 次 用 到 了 用 途 广 泛 的 generate_series 装 数 。 你 可 以 对 日 期 时 间 类 型 使 用 此 函数 ， 
此 时 应 使 用 interval 类 型 值 作为 步 长 。 


如 示例 5-11 所 示 ， 我 们 可 以 用 本 地 日 期 时 间 格 式 来 输入 日 期 ， 也 可 以 使 用 在 国际 上 更 为 通 
用 的 ISO 格式 “Y-M-D” 来 输入 日 期 。PostgreSQL 会 自动 识别 不 同 的 输入 格式 。 为 保险 起 
见 ， 我 们 倾向 于 使 用 ISO 标准 格式 ， 因 为 在 不 同文 化 中 对 于 日 期 的 惯用 格式 是 不 一 样 的 。 
由 于 本 地 设置 的 差异 ， 在 数据 库 服务 器 之 间 甚 至 是 数据 库 实 例 之 间 也 会 存在 这 种 日 期 格式 
差异 。 




















实例 5-11: 使 用 generate_series() 函数 来 生成 时 间 序 列 数 组 
SELECT (dt - interval '1 day')::date As eom 
FROM generate_series('2/1/2012', '6/30/2012', interval '1 month') As dt; 





2012-01-31 
2012-02-29 
2012-03-31 
2012-04-30 
2012-05-31 


另 一 种 经 常 使 用 的 操作 就 是 从 日 期 和 时 间 类 型 的 数值 中 抽取 出 一 部 分 。 在 PostgreSQL 中 ， 
联 用 date_part 和 to_char 函数 可 以 实现 此 目标 。 示 例 5-12 中 ， 除 了 演示 这 两 个 函数 的 用 
法 外 ， 我 们 还 顺便 为 你 演示 了 一 下 带 时 区 信息 的 日 期 时 间 类 型 在 发 生 夏 令 时 变换 时 的 转换 
逻辑 ， 为 此 我 们 特地 挑选 了 一 个 美国 东部 时 区 (US/East) 中 横 跨 夏 令 时 变化 点 的 时 间 段 。 
夏令 时 从 凌晨 2 点 生效 ， 因 此 该 表 的 最 后 一 行 就 是 夏令 时 变化 以 后 的 新 时 间 。 


示例 5-12: 从 日 期 时 间 类 型 中 提取 部 分 元 素 


SELECT dt，date_part('hour' ,dt) As mh, to_char(dt, 'HH12:MI AM' ) As tm 














FROM 

generate_series( '2012-03-11 12:30 AM', '2012-03-11 3:00 AM', interval '15 minutes' 
) As dt; 

dt | mh | tm 

rr be We Ph 
2012-03-11 00:30:00-05 | 0 | 12:30 AM 
2012-03-11 00:45:00-05 | 0 | 12:45 AM 
2012-03-11 01:00:00-05 | 1 | 01:00 AM 
2012-03-11 01:15:00-05 | 1 | 01:15 AM 
2012-03-11 01:30:00-05 | 1 | 01:30 AM 
2012-03-11 01:45:00-05 | 1 | 01:45 AM 
2012-03-11 03:00:00-04 | 3 | 03:00 AM 


generate_series 国 数 默 认 生 成 的 是 timesatamptz 类 型 数据 ， 需 要 显 式 转换 为 timestamp 


5.4 数组 类 型 

数组 在 PostgreSQL 中 扮演 着 重要 的 角色 。 它 在 构造 聚合 国 数 、 形 成 IN 和 ANY 子 句 、 承 
载 数据 类 型 转换 过 程 中 生成 的 中 间 值 等 领域 发 挥 着 重要 作用 。 在 PostgreSQL 中 ， 每 种 
数据 类 型 都 有 相应 的 以 该 类 型 为 基础 的 数组 类 型 。 如 果 你 自 定 义 了 一 个 数据 类 型 ， 那 么 
PostgreSQL 会 在 后 台 自 动 为 此 类 型 创建 一 个 数组 类 型 。 例 如 ，integer 整数 类 型 有 一 个 相 
应 的 整数 数组 类 型 integer[] ， 字 符 类 型 character 也 有 相应 的 字符 数组 类 型 character[]， 
以 此 类 推 。 以 下 我 们 将 向 你 展示 一 些 可 以 快速 构造 出 数组 的 函数 ， 可 以 免除 你 一 个 个 元 素 
录入 的 麻烦 。 此 外 还 有 一 些 用 于 管理 数组 的 函数 。 你 可 以 从 PostgreSQL 官方 手册 的 “数组 
函数 和 运算 符 ” 一 节 (http://www.postgresql.org/docs/current/interactive/functions-array.html) 
中 查 到 全 部 的 数组 函数 和 运算 符 列表 。 
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5.4.1 数组 构造 函数 
最 基本 的 构造 数组 的 方法 就 是 一 个 个 元 素 手动 录入 ， 话 法 如 下 : 


SELECT ARRAY[2001, 2002, 2003] As yrs; 





如 果 数 组 元 素 存在 于 一 个 查询 返回 的 结果 集中 ， 那 么 可 以 使 用 这 个 略 复杂 一 些 的 构造 函数 
array() 来 生成 数组 : 





SELECT array( 

SELECT DISTINCT date_part('year', log_ts) FROM Logs ORDER BY date_part('year ' ， 

log_ts) 

); 
尽管 array 函数 仅 能 用 于 将 单字 段 的 查询 结果 集 转换 为 数组 ， 但 你 依然 可 以 指定 一 个 复合 
数据 类 型 作为 查询 结果 ， 这 种 情况 下 可 以 获得 多 列 结果 。 我 们 会 在 本 章 后 续 的 5.8 节 中 演 
示 该 用 法 。 


你 可 以 把 一 个 直接 以 字符 串 格 式 书写 的 数组 转换 为 一 个 真正 的 数组 ， 语 法 如 下 : 





SELECT '{Alex,Sonia}'::text[] As name, '{43,40}'::smallint[] As age; 


{Alex,Sonia} 1 {43,40} 








你 还 可 以 用 string_to_array 国 数 将 一 个 用 固定 分 隔 符 分 隔 的 字符 串 转 换 为 数组 ， 如 示例 
5-13 所 示 。 


示例 5-13: 将 一 个 分 隔 符 格式 的 字符 串 转 换 为 数组 


SELECT string_to_array('ca.ma.tx', '.') As estados; 











estados 


{ca,ma, tx} 














array_agg 是 一 种 变型 聚合 国 数 ， 它 可 以 采用 一 组 任何 类 型 的 数据 并 将 其 转换 为 数组 ， 如 
示例 5-14 所 示 。 





示例 5-14: array_agg 国 数 的 使 用 


SELECT array_agg(Log_ts ORDER BY Log_ts) As x 
FROM Logs 
WHERE Log_ts BETWEEN '2011-01-01'::timestamptz AND '2011-01-15'::timestamptz; 


{'2011-01-01', '2011-01-13', '2011-01-14'} 





5.4.2 引用 数组 中 的 元 素 

一 般 来 说 ， 我 们 会 通过 数组 下 标 来 引用 数组 元 素 ， 请 特别 注意 PostgreSQL 的 数组 下 标 从 1 
开始 。 如 果 你 试图 越界 访问 一 个 数组 ， 也 就 是 说 数组 下 标 已 经 超过 了 数组 元 素 的 个 数 ， 那 
么 不 会 返回 错误 ， 而 是 会 得 到 一 个 空 值 NULL。 下 面 的 例子 演示 了 获取 数组 的 第 一 个 和 最 后 
一 个 元 素 的 方法 : 











SELECT fact_subcats[1] AS primero, 
fact_subcats[array_upper(fact_subcats, 1)] As segundo 
FROM census.luyu_fact_ types; 


我 们 使 用 array_upper 函数 来 获取 数组 元 素 的 个 数 ， 该 函数 的 第 二 个 必需 的 形 参 代表 数组 
的 维度 。 在 本 例 中 ， 数 组 是 一 维 的 ， 但 PostgreSQL 支持 多 维 数组 。 


5.4.3 ”数组 的 拆 分 与 连接 

PostgreSQL 支持 使 用 start:end 语法 对 数组 进行 拆 分 。 操 作 结果 是 原 数组 的 一 个 子 数 
组 。 例 如 ， 如 果 要 得 到 一 个 仅 包含 当前 数组 第 2 个 至 第 4 个 元 素 的 新 数组 ， 可 以 使 用 以 
下 语法 ; 




















SELECT fact_subcats[2:4] FROM census.Lu_fact_types; 
如 果 要 将 两 个 数组 连接 到 一 起 ， 可 以 使 用 连接 运算 符 ||: 


SELECT fact_subcats[1:2] || fact_subcats[3:4] FROM census.Lu_fact_types; 


5.4.4 将 数组 元 素 展开 为 记录 行 
另外 一 个 常用 的 数组 操作 国 数 是 unnest， 通 过 它 可 以 将 数组 元 素 纵向 展开 成 一 个 包含 若干 
条 记录 的 结果 集 ， 如 示例 5-15 所 示 。 
示例 5-15: 使 用 unnest 函数 将 数组 纵向 展开 
SELECT unnest('{XOX,0X0,XOX}'::char(3)[]) As tic tac toe; 
tic_ tac_toe 
xox 
OXO 
XOX 


你 可 以 在 一 个 SELECT 语句 中 使 用 多 个 unnest 函数 ， 但 如 果 每 个 unnest 展开 后 的 记录 行 3 
不 一 致 ， 或 者 说 “对 不 齐 ”， 那 么 得 到 的 最 终结 果 将 是 这 些 结果 集 之 间 的 笛 卡 儿 积 ， 看 起 
来 不 太 好 理解 。 


示例 5-16 演示 了 一 个 unnest 展开 后 可 对 齐 的 结果 集 ， 也 就 是 说 每 个 unnest 都 输出 3 行 记 
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录 ， 最 终 连 接 成 的 记录 也 是 3 行 ， 这 也 是 我 们 一 般 希 望 见 到 的 结果 。 
示例 5-16: 多 个 可 对 齐 数组 的 展开 效果 


SELECT 
unnest('{three,blind,mice}'::text[]) As tt, 
unnest('{1,2,3}'::smallint[]) As i; 








Cl 
three |1 
blind |2 
mice |3 


如 果 你 从 上 述 一 个 数组 中 拿 掉 一 个 元 素 ， 那 么 两 个 数组 的 元 素 就 无 法 对 齐 了 ， 此 时 展开 得 
到 的 结果 如 示例 5-17 所 示 。 


示例 5-17: 多 个 无 法 对 齐 的 数组 展开 后 的 效果 
SELECT 
unnest( '{blind,mouse}'::varchar[]) As v， 
unnest('{1,2,3}'::smallint[]) As i; 





PostgreSQL 9.4 版 3| 入 了 一 个 多 实 参 unnest 函数 ， 该 函数 会 在 数组 不 平衡 的 位 置 置 入 空 占 
位 符 。 新 的 unnest 的 主要 缺点 是 ， 它 仅 可 以 在 FROM 子 句 中 出 现 。 示 例 5-18 使 用 9.4 版 构 
造 重 新 访问 我 们 的 不 平衡 数组 。 

示例 5-18: 使 用 多 实 参 unnest 取消 不 平衡 数组 的 磐 套 


SELECT * FROM unnest('{blind,mouse}'::text[], '{1,2,3}'::int[]) As f(t,i); 








mouse 
<NULL> 


5.5 区间 类 型 

区 间 数 据 类 型 (http://www.postgresql.org/docs/current/interactive/rangetypes.html) 是 9.2 版 
引入 的 一 项 新 特性 ， 该 数据 类 型 可 以 定义 一 个 值 区 间 。 由 于 该 类 型 的 出 现 ， 原 本 需要 两 个 
字段 才能 定义 的 区 间 现 在 仅 使 用 一 个 字段 即 可 。PostgreSQL 为 区 间 类 型 提供 了 很 多 配套 的 
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运算 符 和 函数 ， 例 如 判定 区 间 是 否 重合 ， 判 定 某 个 值 是 否 落 在 区 间 内 ， 以 及 将 相 邻 的 若干 
区 间 合 并 为 一 个 完整 的 区 间 等 。 在 出 现 区 间 类 型 之 前 ， 类 似 操作 只 能 通过 写 函 数 实现 ， 这 
种 操作 很 繁琐 ， 不仅 低 效 而 且 很 容易 出 错 ， 并 且 写 出 的 函数 不 一 定 能 达到 预想 的 效果 ， 在 
对 于 时 间 类 型 的 操作 中 尤其 如 此 。 在 我 们 自己 的 项 目 中 ， 我 们 在 所 有 需要 表示 时 间 范 围 的 
表 中 都 用 上 了 区 间 类 型 ,事实 证 明 效 果 很 好 。 我 们 希望 你 也 能 分 享 我 们 这 一 成 功 经 验 。 















































有 了 区 间 类 型 后 ， 就 不 再 需要 用 两 个 字段 来 定义 一 个 区 间 。 假 设 我 们 希望 定义 一 个 大 于 等 
于 -2 小 于 2 的 整数 区 间 ， 该 区 间 的 写法 是 [-2,2)， 左 边 中 括号 表示 左边 是 闲 区 间 ， 即 值 
域 包含 -2， 右边 小 括号 表示 右边 是 开 区 间 ， 即 值 域 不 包含 2。 那 么 [-2,2) 这 个 整数 区 间 包 
含 的 元 素 有 : -2，-1，0，1。 类 似 地 ， 可 以 知道 以 下 整数 区 间 所 包含 的 元 素 。 

。 整数 区 间 (-2,2] 含 四 个 元 素 : -1、90、1、 
。 整数 区 间 (-2,2) 含 三 个 元 素 : -1、0、1。 
。 整数 区 间 [-2,2] 含 五 个 元 素 : -2、-1、0、1、2。 
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5.5.1 离散 区 间 和 连续 区 间 

PostgreSQL 对 离散 区 间 和 连续 区 间 是 区 别 对 待 的 。 整 数 类 型 或 者 日 期 类 型 的 区 间 是 离散 区 
间 ， 因 为 区 间 内 每 一 个 值 都 是 可 以 被 枚 举 出 来 的 。 数 字 区 间或 者 时 间 惟 区 间 就 是 一 个 连续 
葡 间 ， 因 为 区 间 内 的 值 有 无 限 多 。 


一 个 离散 区 间 有 多 种 表示 方法 ， 比 如 我 们 前 面 提 到 的 [-2,2) 这 个 例子 ， 它 就 可 以 换 用 多 
种 写法 而 且 每 种 方式 的 效果 完全 一 样 : [-2,1]、(-3,1]、(-3,2) 和 [-2,2)。 这 四 种 写法 
中 ，PostgreSQL 规定 [-2,2) 为 规范 写法 ， 并 不 是 因为 这 种 写法 有 什么 优势 ， 仅 仅 是 因为 
统一 后 有 利于 运算 ， 不 用 每 次 计算 时 都 要 先 考虑 是 开 区 间 还 是 闭 区 间 这 件 事 。PostgreSQL 
会 自动 对 所 有 的 离散 区 间 进 行规 范 化 ， 不 管 是 存储 还 是 显示 时 都 会 这 么 做 。 因 此 ， 如 果 你 
输入 了 一 个 时 间 区 间 (2014-1-5,2014-2-1] ， 那 么 PostgreSQL 会 自动 把 它 改写 为 [2014-01- 
06,2014-02-02) 。 





x 
































5.5.2 原生 支持 的 区 间 类 型 
PostgreSQL 原生 支持 六 种 区 间 类 型 ， 都 是 关于 数字 型 和 日 期 时 间 型 。 





。 int4range、int8range 


这 是 整数 型 离散 区 间 ， 其 定义 符合 前 团 后 开 的 规范 化 要 求 。 





。 numrange 


这 是 连续 区 间 ， 可 以 用 于 描述 小 数 、 序 点 数 、 或 者 双 精 度数 字 的 区 间 。 


。 daterange 


这 是 不 带 时 区 信息 的 日 期 离散 区 间 。 
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tsrange、 tstzrange 
这 是 时 间 惟 〈 日 期 加 时 间 ) 类 型 的 连续 区 间 ， 秒 值 部 分 支持 小 数 。tsrange 不 带 时 区 信 
息 ，tstzrange 带 时 区 信息 。 




















对 于 数字 类 型 的 区 间 来 说 ， 如 果 区 间 的 起 点 值 或 者 终点 值 未 指定 ， 那 么 PostgreSQL 会 自动 
为 其 填 入 null 值 。 理 论 上 讲 ， 你 可 以 将 该 null 解释 为 代表 左 侧 的 -infinity ( 负 无 穷 ) 或 
右 侧 的 infinity ( 正 无 穷 )。 实 际 上 ， 你 会 受 限于 特定 数据 类 型 的 最 小 值 和 最 大 值 。 比 如 
对 于 int4range 数据 类 型 来 说 ， 区 间 (,) 实际 上 代表 的 是 [-2147483648,2147483647)。 





对 于 时 间 类 型 的 区 间 来 说 ，-infinity 和 infinity 就 是 有 效 的 上 限 和 下 限 。 





除了 系统 原生 支持 的 区 间 类 型 外 ， 你 还 可 以 自 定义 区 间 类 型 ， 可 以 设 定 为 离散 区 间 也 可 以 
设 定 为 连续 区 间 。 


5 





.5.3 定义 区 间 的 方法 


任何 类 型 的 区 间 都 是 由 相同 数据 类 型 的 起 点 值 和 终点 值 外 加 表示 区 间 开 闭 的 符号 [、]、 


〈、 


) 构成 。 如 示例 5-19 所 示 。 


示例 5-19: 使 用 类 型 转换 的 方法 来 定义 区 间 





SELECT '[2013-01-05,2013-08-13]'::daterange; @ 

SELECT '(2013-01-05,2013-08-13]'::daterange; @ 

SELECT '(0,)'::int8range; © 

SELECT '(2013-01-05 10:00,2013-08-13 14:00]'::tsrange; @ 


[2013-01-05,2013-08-14) 
[2013-01-06,2013-08-14) 


[1,) 
("2013-01-05 10:00:00","2013-08-13 14:00:00"] 


定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 闭 区 间 。 请 注意 此 处 区 间 终 点 的 写法 
是 不 规范 的 。 

定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 半 开 半 闭 区 间 。 请 注意 此 处 的 写法 是 
不 规范 的 。 

定义 了 一 个 大 于 0 小 于 等 于 正 无 穷 大 的 整数 区 间 。 请 注意 此 处 的 写法 是 不 规范 的 。 
定义 了 一 个 从 2013-01-05 10:00 到 2013-08-13 14:00:00 的 半 开 半 闭 连续 区 间 。 

















PostgreSQL 中 的 日 期 时 间 类 型 可 以 接受 -infinity ( 负 无 穷 ) 或 者 infinity 
( 正 无 穷 ) 作为 其 值 。 为 了 与 传统 写法 保持 一 致 ， 我 们 建议 你 还 是 以 前 闭 后 
开 方式 来 书写 tsrange 和 tstarange 这 类 连续 区 间 ， 即 区 间 起 点 使 用 左 中 括 
号 “[”， 区 间 终 点 使 用 右 小 括号 “) 。 
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区 间 也 可 以 使 用 constructor range 函数 来 定义 ， 该 函数 的 名 称 与 区 间 名 称 是 一 致 的 ， 可 
以 输入 两 个 或 者 三 个 实 参 。 示 例如 下 : 








SELECT daterange('2013-01-05','infinity','[]'); 


第 三 个 实 参 是 区 间 边 界 开 闭 标识 符 ， 如 果 不 填 则 默认 为 [)。 为 清晰 起 见 ， 我 们 建议 你 总 是 
显 式 指定 该 实 参 ， 因 为 其 默认 值 不 是 那 种 非常 显而易见 的 值 ， 容 易 被 记 错 。 


5.5.4 定义 含 区 间 类 型 字段 的 表 

时 间 类 型 区 间 是 很 常用 的 ， 假 设 你 有 一 张 employment 表 ， 表 中 存储 了 公司 聘请 雇员 的 历史 
记录 。 你 可 以 像 示 例 5-20 那样 用 时 间 区 间 来 定义 一 个 员工 在 公司 的 服务 年 限 ， 而 不 需要 用 
起 始 时 间 和 结束 时 间 两 个 字段 来 表示 。 在 本 例 中 ， 我 们 给 period 列 添加 了 一 个 索引 以 使 用 
我 们 的 区 间 列 加 速 查询 。 














示例 5-20: 建立 一 个 带 有 日 期 区 间 类 型 字段 的 表 
CREATE TABLE employment (id serial PRIMARY KEY, employee varchar(20), period dater 
ange); 
CREATE INDEX idx_employment_period ON employment USING gist (period); © 
INSERT INTO employment (employee, period) 
VALUES ('Alex', '[2012-04-24, infinity)'::daterange), ('Sonia', '[2011-04-24, 
2012-06-01)'::daterange), ('Leo', '[2012-06-20, 2013-04-20)'::daterange), ('Regi 
na', '[2012-06-20, 2013-04-20)'::daterange); 





@ 在 区 间 字 段 上 建立 一 个 GiST 索引 。 


5.5.5 ”适用 于 区 间 类 型 的 运算 符 

区 间 类 型 上 用 得 最 多 的 两 个 运算 符 是 重合 运 算 符 (8&&) 和 包含 运算 符 (@>)。 要 了 解 区 间 运 
算 符 的 完整 列表 ， 请 参考 PostgreSQL 官方 手册 中 的 “区 间 类 型 运算 符 ” 一 节 (http://www. 
postgresql.org/docs/currentUinteractive/functions-range.html#RANGE-OPERATORS-TABLE)。 








1. 重 又 运算 符 

顾名思义 ， 重 又 运算 符 级 的 作用 就 是 判定 两 个 区 间 是 否 有 重合 部 分 ， 如 果 有 则 返回 true， 
否则 返回 false。 示 例 5-21 演示 了 该 运算 符 的 用 法 ， 其 中 还 使 用 了 string_agg 函数 将 雇员 
名 单列 表 合 并 成 一 个 文本 字段 。 


示例 5-21: 查询 谁 与 谁 曾经 同时 在 公司 工作 过 
SELECT el1.employee, string_agg(DISTINCT e2.employee, ', ' ORDER BY e2.employee) As 
colleagues 
FROM empLoyment As el INNER JOIN empLoyment As e2 
ON el1.period && e2.period 
WHERE el.empLoyee <> e2.employee 
GROUP BY el.employee; 
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empLoyee | coLLeagues 
i 下 


ALex | Leo, Regina, Sonia 
Leo | Alex, Regina 
Regina | Alex, Leo 

Sonia | Alex 


2. 包含 与 被 包含 关系 运算 符 

对 于 包含 关系 运算 符 @> 来 说 ， 第 一 个 实 参 是 区 间 ， 第 二 个 实 参 是 待 判定 的 值 。 如 果 第 二 
个 实 参 的 值 是 落 在 第 一 个 实 参 的 区 间 内 的 话 ， 运 算 符 就 返回 true， 否 则 返回 fatse。 示 例 
5-22 演示 了 其 用 法 : 


示例 5-22: 查询 当前 还 在 公司 工作 的 雇员 名 单 


SELECT employee FROM empLoyment WHERE period @> CURRENT_DATE GROUP BY employee; 








employee 


Alex 





<@ 是 用 于 判定 被 包含 关系 是 否 成 立 的 运算 符 ， 它 的 第 一 个 实 参 是 待 判定 的 值 ， 第 二 个 实 参 
是 区 间 ， 其 用 法 与 包含 关系 运算 符 完全 一 致 ， 不 再 费 述 。 


5.6 JSON 数 据 类 型 


JSON 数据 类 型 及 其 相关 操作 函数 是 从 9.2 版 开始 支持 的 。JSON 是 Web 开发 领域 非常 流 
行 的 一 种 数据 类 型 ， 它 是 JavaScript 语言 中 的 通用 数据 交换 格式 。9.3 版 针对 JSON 类 型 新 
增 了 一 些 功能 函数 ， 用 以 执行 读 取 、 编 辑 以 及 转换 为 其 他 数据 类 型 等 操作 。 有 了 这 些 函 数 
以 后 ，PostgreSQL 对 于 JSON 的 支持 力度 大 大 增强 。9.4 版 引入 了 jsonb 数据 类 型 ， 该 类 
型 是 JSON 类 型 的 二 进 制 版 本 ， 它 与 JSON 类 型 最 主要 的 差别 是 JSONB 可 以 支持 索引 而 
JSON 不 能 。 以 下 我 们 将 主要 介绍 9.3 版 中 引入 的 JSON 处 理 函 数 和 相关 运算 符 。 此 外 也 会 
介绍 如 何 使 用 jsonb， 如 何 使 用 jsonb 与 其 json 同胞 共享 的 函数 ， 以 及 如 何 使 用 jsonb 所 
支持 的 运算 符 。 前 述 运 算 符 和 函数 的 完整 列表 可 参考 PostgreSQL 官方 手册 中 “JSON 类 型 
的 处 理 函 数 和 运算 符 ”(http:/www.postgresql.org/docs/current/interactive/functions-json.htm]l) 





























这 下 oo 


5.6.1 插入 JSON 数 据 
要 想 在 表 中 存储 json 数据 ， 只 需 建 一 个 json 类 型 的 字段 即 可 ， 语 法 如 下 : 














CREATE TABLE families _j (id serial PRIMARY KEY, profile json); 


示例 5-23 的 语句 向 表 中 插入 了 一 条 JSON 记录 。PostgreSQL 会 自动 对 插入 的 JSON 文本 进 
行 格式 检查 以 确保 其 合法 。 
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示例 5-23: 插入 一 条 JSON 数据 记录 
INSERT INTO families j (profile) VALUES ( 
'{"name":"Gomez", "members":[ 
{"member":{"relation":"padre", "name":"Alex"}}, 
{"member":{"relation":"madre", "name":"Sonia"}}, 
{"member":{"relation":"hijo", "name":"Brandon"}}, 
{"member":{"relation":"hija", "name":"Azaleah"}} 


I 


无 效 的 JSON 字符 串 是 无 法 转换 为 json 类 型 的 ， 同 样 也 无 法 将 无 效 的 JSON 
字符 串 存储 到 某 个 json 列 中 。PostgreSQL 会 在 后 台 进 行 检查 以 确保 JSON 
字符 串 运 行 良好 ， 然 后 才 会 让 JSON 字符 串 驻 留 到 数据 库 中 。 














5.6.2 ”查询 JSON 数 据 


9.3 版 中 引入 了 多 种 访问 JSON 数据 的 函数 。 es 5-24 使 用 了 json_extract_path、json_ 
array_elements [以 及 json_extract_path_text 这 函数 来 读 取 表 中 所 有 家 庭 成 员 的 信息 。 


示例 5-24: 查询 JSON 数据 块 中 的 元 素 
SELECT json_extract_path_text(profile, 'name') As famtLy，@ json_ex 
tract_path_text( @ json_array_eLements( @ json extract path(profile,'mem 
bers') @ ), 'member','name' ) As member 
FROM families j; 


family |member 


Gomez |Brandon 
Gomez |Azaleah 


@ 提取 出 家 庭 的 名 称 ， 以 文本 格式 输出 。 
@ 提取 出 家 庭 成 员 的 名 称 ， 以 文本 格式 输出 。 
@ 将 家 庭 成 员 信息 数组 中 的 每 个 元 素 展 开 为 独立 的 JSON 对 象 。 
@ 获取 所 有 家 庭 成 员 的 信息 列表 ， 作 为 一 个 独立 的 JSON 对 象 输出 。 
运算 符 ->> 和 #> 是 json_extract_path_text 的 简写 。#>> 取 用 某 个 路 径 数 组 。 示 例 5-25 
使 用 这 些 符号 运算 符 对 示例 5-24 进行 了 重 写 。 
示例 5-25: 使 用 运算 符 实现 与 按 路 径 读 取 函 数 相同 的 功能 
SELECT profile->>'name' As family, json_array_elements((profile->'members')) #>> 


'{member ,name}'::text[] As member 
FROM families j; 








json_extract_path 是 json_extract_path_text 的 兄弟 函数 ， 它 对 应 的 运算 符 是 -> 和 #>。 
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该 函数 输出 的 执行 结果 是 当前 JSON 对 象 的 子 对 象 。 如 果 要 把 一 个 复合 JSON 对 象 ( 即 
包含 多 条 记录 的 JSON 对 象 ， 比 如 本 例 中 的 members 对 象 就 是 一 个 包含 了 多 条 家 庭 成 员 信 
息 记录 的 复合 JSON 对 象 ) 剥离 出 来 并 传递 给 别 的 函数 做 进一步 处 理 ， 就 需要 使 用 json_ 
extract_path 国 数 。 























如 果 你 使 用 的 是 9.2 版 ， 情 况 会 稍微 有 点 麻烦 ， 因 为 该 版 本 中 未 原生 提供 能 方便 地 访问 
JSON 数据 的 函数 ， 但 可 以 通过 自行 编写 PL/V8 函数 来 实现 类 似 9.3 版 中 提供 的 JSON 
函数 的 功能 。 我 们 在 “使 用 PLV8 语言 来 编写 JSON 访问 函数 ”这 篇 博文 (http://www. 
postgresonline.com/journal/archives/272-Using-PLV8-to-build-JSON-selectors.html) 中 介绍 了 
如 何 编 写 jQuery 风格 的 JSON 数据 访问 函数 。 








有 若干 函数 可 用 于 处 理 JSON 数组 数据 ， 前 面 我 们 已 经 在 示例 5-25 中 演示 了 json_array_ 
elements 这 个 函数 的 用 法 。 此 外 还 有 一 个 可 以 查询 数组 元 素 个 数 的 json_array_length 函 
数 以 及 可 以 根据 下 标 引 用 JSON 数组 元 素 的 运算 符 ->。 你 可 以 级 联 使 用 多 个 运算 符 来 定位 
到 JSON 对 象 内 部 的 某 个 子 对 象 ， 如 示例 5-26 所 示 。 


示例 5-26: 查询 members 对 象 的 子 对 象 
SELECT id, json_array_length(profile->'members') As numero, profile->'members'- 
>0#>>' {member ,name}'::text[] As primero 
FROM families j; 














id | numero | primero 

















示例 5-26 中 使 用 了 -> 运算 符 的 两 种 形式 。-> 运算 符 的 返回 结果 永远 是 一 个 json 或 者 
jsonb 对 象 ， 但 该 运算 符 的 第 二 个 实 参 要 么 是 一 个 text 字段 (json_object_field 的 简 
写 )， 要 么 是 一 个 integer (json_array_element 的 简写 )。 因 此 profile->'members' 会 
返回 JSON 对 象 的 members 字段 ， 该 字段 本 身 是 一 个 包含 多 条 记录 的 JSON 数组 。->9 操 
作 提 取出 了 JSON 对 象 数 组 的 首 个 元 素 。 在 本 例 中 ，->9 得 到 的 是 首 个 家 庭 成 员 的 信息 。 
#>>' {member ,namej': :text[] 就 是 json_extract_path_text 操作 ， 得 到 的 结果 是 首 个 家 庭 
成 员 JSON 对 象 中 按照 “membername” 路 径 寻 址 到 的 节点 的 文本 格式 的 值 。 通 过 这 个 例 
子 你 应 该 可 以 看 出 来 ， 这 些 运 算 符 是 可 以 级 联 使 用 的 。jsonb 类 型 也 有 相同 的 运算 符 ， 不 
过 其 对 应 的 函数 分 别 是 jsonb_object_field 和 jsonb_array_element， 可 以 看 到 就 是 把 函数 
名 中 的 “json” 换 成 了 “jsonb”， 其 他 函数 以 此 类 推 。 




















JSON 数组 下 标 是 从 0 开始 ， 但 PostgreSQL 的 数组 下 标 是 从 1 开始 。 








5.6.3 输出 JSON 数 据 

PostgreSQL 除了 可 以 查询 库 中 已 有 的 JSON 数据 外 ， 还 支持 将 别 的 数据 类 型 转换 为 JSON 
类 型 。 接 下 来 的 例子 里 面 ， 我 们 将 演示 系统 内 置 的 JSON 转换 函数 的 用 法 ， 这 类 函数 可 以 
将 其 他 数据 类 型 转换 为 JSON 类 型 。 

示例 5-27 中 ， 我 们 将 使 用 row_to_json 函数 将 前 面 示例 5-23 中 导入 的 数据 的 部 分 字段 转换 
为 JSON 数据 。 


示例 5-27: 将 多 条 记录 转换 为 单个 JSON 对 象 (PostgreSQL 9.3 及 之 后 的 版 本 才 支 持 该 语句 ) 


SELECT row_to_json(f) As x 
FROM (SELECT id, profile->>'name' As name FROM families j) As f; 





了 





























{"id":1,"name":"Gomez"} 


如 果 要 将 families 表 中 的 所 有 记录 行 整体 打包 转换 为 一 个 JSON 对 象 ， 可 以 使 用 以 下 语法 
(PostgreSQL 9.2 及 之 后 的 版 本 均 支 持 该 语法 ) : 


SELECT row_to_json(f) FROM families j As f; 
“查询 时 将 一 行 记录 作为 单个 字段 输出 ”这 种 功能 只 有 PostgreSQL 才 支 持 。 该 功能 对 于 创 
建 复合 JSON 对 象 特别 有 用 。 我 们 将 在 7.2.10 节 中 深入 讨论 此 特性 ， 并 且 在 示例 7-16 中 


演示 如 何 使 用 array_agg 和 array_to_json 函数 将 多 条 记录 转换 为 一 个 JSON 对 象 后 输出 。 
9.3 版 新 增 了 对 json_agg 函数 的 支持 ， 我 们 将 在 示例 7-17 中 演示 此 函数 的 用 法 。 











5.6.4 ” JSON 类 型 的 二 进 制版 本 : jsonb 

PostgreSQL 9.4 版 中 引入 了 新 的 jsonb 数据 类 型 。 从 运算 符 的 角度 看 ，jsonb 有 若干 json 
类 型 不 支持 的 运算 符 ， 此 外 二 者 的 运算 符 完全 相同 。 从 处 理 函 数 角 度 看 ， 二 者 适用 的 处 理 
国 数 一 一 对 应 ， 仅 在 命名 上 略 有 差别 ， 一 个 以 “json” 开 头 ， 一 个 以 “jsonb” 开 头 。jsonb 
数据 类 型 和 json 数据 类 型 的 关键 区 别 如 下 所 示 。 


。 json 是 以 原始 文本 格式 存储 的 ， 而 jsonb 存储 的 是 原始 文本 解析 以 后 生成 的 二 进 制 数据 
结构 ， 该 二 进 制 结构 中 不 再 保存 原始 文本 中 的 空格 ， 存 储 下 来 的 数字 的 形式 也 发 生 一 定 
的 变化 ， 并 且 对 其 内 部 记录 属性 值 进行 了 排序 。 例 如 ， 文 本 中 的 e-5 这 种 数字 会 被 转换 
为 对 应 的 小 数 存储 。 

。 jsonb 不 允许 其 内 部 记录 的 键 值 重复 ， 如 果 出 现 重复 则 会 从 中 自动 选择 一 条 ， 其 余 的 
重复 记录 会 被 丢弃 ， 但 json 类 型 中 记录 键 值 重复 是 允许 的 。Michael Paquier 的 “利用 
jsonb 类 型 不 允许 键 值 重复 的 特性 来 管理 jsonb 数据 ”博文 (http://michael.otacoo.com/ 
postgresql-2/manipulating-jsonb-data-with-key-unique/) 中 演示 了 若干 例子 。 
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。 jsonb 的 性 能 远 好 于 json。 因 为 jsonb 类 型 在 处 理 过 程 中 不 需要 再 进行 文本 解析 。 

。 jsonb 类 型 由 于 是 解析 过 的 二 进 制 结构 ， 因 此 jsonb 类 型 的 字段 上 可 以 直接 建立 GIN 索 
引 (该 类 索引 在 6.3 节 中 有 相关 介绍 ) ， 但 json 类 型 字段 上 却 只 能 建立 函数 索引 ， 因 为 
只 有 通过 函数 才能 从 JSON 的 字符 串 中 提取 出 具体 字段 值 。 




















为 了 说 明 以 上 概念 ， 我 们 另外 新 建 一 张 与 前 面 families_j 结构 类 似 的 famitLies_b 表 ， 只 
不 过 这 次 用 的 是 jsonb 类 型 


CREATE TABLE families_b (id serial PRIMARY KEY, profile jsonb); 
重复 执行 示例 5-23 的 步骤 ， 往 新 表 中 插入 记录 。 


目前 为 止 还 没 体现 出 JSON 和 JSONB 的 差别 ， 但 在 对 两 张 表 分 别 执行 查询 时 就 能 看 出 来 
了 。 为 了 让 JSONB 类 型 的 二 进 制 字段 值 能 够 显示 ，PostgreSQL 会 自动 将 其 转换 为 规范 化 
的 文本 表示 形式 ， 如 示例 5-28 所 示 。 























示例 5-28: JSONB 与 JSON 类 型 输出 格式 对 比 


SELECT profile As b FROM families b WHERE id = 1; © 

SELECT profile As j FROM families j WHERE id = 1;@ 

b 

{"name": "Gomez", "members": [{"member": {"name": "Alex", "relation": "padre"}} 
,，{"member": {"name": "Sonia", "relation": "madre"}}, {"member": {"name": "Brand 
on", "relation": "hijo"}}, {"member": {"name": "Azaleah", "relation": "hija"}}]} 
] 


{"name":"Gomez","members":[{"member":{"relation":"padre", "name":"Alex"}}, 
{"member":{"relation":"madre", "name":"Sonia"}}, 
{"member":{"relation":"hijo", "name":"Brandon"}}, 
{"member":{"relation":"hija", "name":"Azaleah"}}]} 





@ 可 以 看 出 ，jsonb 类 型 的 输出 是 对 输入 的 内 容 进行 了 重新 格式 化 并 删 掉 了 输入 时 文本 中 
的 空格 ， 此 外 relation 和 name 这 两 个 属性 字段 的 显示 顺序 与 输入 时 的 顺序 相 比 发 生 了 
@ json 类 型 的 输出 保持 了 输入 时 的 原样 ， 包 括 原文 本 中 的 空格 以 及 属性 字段 的 顺序 。 


























jsonb 与 json 的 处 理 国 数 一 一 对 应 ， 但 国 数 名 略 有 不 同 ，jsonb 支持 的 运算 符 集合 是 json 
支持 的 运算 符 集 合 的 超 集 。 例 如 json 适用 的 json_extract_path_text 和 json_each 函数 对 
应 于 jsonb 适用 的 jsonb_extract_path_text 和 jsonb_each 国 数 。 除 了 jsonb 特有 的 那 几 个 
运算 符 以 外 ， 二 者 的 运算 符 完 全 相同 ， 因 此 如 果 要 想 把 示例 5-25 和 示例 5-26 中 的 语句 改 
造 为 适用 jsonb 类 型 ， 只 需 把 表 名 蔡 换 一 下 (families_j 改 为 families_b) ,然后 把 json_ 
array_Length 替换 为 jsonb_array_Length 即 可 。 











jsonb 比 json 多 支持 的 运算 符 有 以 下 几 个 : 等 值 运算 符 〈=)、 包 含 关系 运算 符 〈@>)、 被 
包含 关系 运算 符 〈<@)、 键 值 已 存在 运算 符 〈?)、 一 组 键 值 中 是 否 有 任意 一 个 已 存在 运算 
符 (?1)、 一 组 键 值 中 的 每 一 个 是 否 均 已 存在 运算 符 〈?&)。 


假设 我 们 要 列 出 所 有 包含 姓名 为 “Alex” 的 家 庭 成 员 的 家 庭 ， 就 可 以 使 用 包含 关系 判定 运 
算 符 ， 如 示例 5-29 所 示 。 








示例 5-29: JSONB 包含 关系 运算 符 的 使 用 
SELECT profile->>'name' As family 
FROM families_b 
WHERE profile @> '{"members":[{"member":{"name":"Alex"} }]}'; 


如 果 在 jsonb 列 上 建 了 GIN 索引， 那么 前 述 这 几 个 运算 符 的 操作 速度 是 极 快 的 : 
CREATE INDEX idx_familes_jb_profile_ gin ON families_b USING gin (profile); 


我 们 演示 用 的 这 些 表 都 很 小 ， 因 此 规划 器 可 能 会 选择 走 全 表 扫 描 而 不 是 走 索 引 查询 ， 但 如 
果 有 更 多 的 记录 ， 示 例 5-29 中 这 种 语句 是 一 定 会 用 上 索引 的 。 


5.7 ”XML 数据 类 型 


XML 和 JSON 这 两 种 数据 类 型 都 属于 非 规范 化 数据 ， 在 关系 型 数据 库 中 存储 这 类 数据 其 
实 是 有 争议 的 。 然 而 ， 所 有 的 高 级 关系 型 数据 库 (比如 IBM DB2、Oracle、SQL Server) 
中 都 支持 XML 数据 类 型 。 作 为 最 先进 的 开源 关系 型 数据 库 ，PostgreSQL 自然 也 会 支持 
XML 数据 类 型 ， 并 且 还 提供 了 大 量 XML 操作 函数 。 我 们 发 表 过 很 多 关于 在 PostgreSQL 
中 使 用 XML 数据 类 型 的 技术 文章 (http:/www.postgresonline.com/journal/index.php?/ 
plugin/tag/xml) 。PostgreSQL 原生 支持 创建 、 管 理 和 解析 XML 数据 的 函数 ， 详 细 列 表 可 
参见 PostgreSQL 官方 手册 中 “XML 函数 ”这 一 节 (http:/www.postgresql.org/docs/current/ 
interactive/functions-xml.html) 。 与 jsonb 数据 类 型 不 一 样 ， 目 前 没有 哪 种 索引 类 型 支持 直 
接 对 XML 数据 类 型 进行 索引 ， 因 此 只 能 使 用 函数 索引 对 其 一 部 分 数据 进行 索引 ， 这 一 点 
与 json 是 相同 的 。 

















5.7.1 插入 XML 数据 


在 往 一 个 xml 数据 类 型 的 列 中 插入 数据 时 ，PostgreSQL 会 自动 判定 并 确保 只 有 格式 合法 的 
XML 才 会 创建 成 功 。text 类 型 字段 中 也 可 以 存 和 一段 XML 文本 ， 但 是 存 入 时 不 会 进行 格 
式 合法 性 判断 ， 这 一 点 是 text 与 xmt 类 型 的 区 别 。 不 过 请 注意 ， 即 使 XML 文本 的 内 容 中 
附带 了 DTD 或 者 XSD 的 格式 描述 ，PostgreSQL 也 不 会 按照 这 些 格式 要 求 来 对 XML 的 格 
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式 进行 验证 。 为 了 梳理 一 下 构成 有 效 XML 的 要 素 ， 示 例 5-30 向 你 展示 了 通过 将 某 个 列 声 
明 为 xml 并 照常 将 数据 插入 到 该 列 中 ， 你 如 何 将 XML 数据 追加 到 表 中 。 





示例 5-30: 插入 XML 字段 记录 


CREATE TABLE families (id serial PRIMARY KEY, profile xml); 
INSERT INTO families(profile) 
VALUES( 

'<family name="Gomez"> 
<member><relation>padre</relation><name>Alex</name></member> 
<member><relation>madre</relation><name>Sonia</name></member> 
<member><relation>hijo</relation><name>Brandon</name></member> 
<member><relation>hija</relation><name>Azaleah</name></member> 
</family>'); 


XML 数据 的 格式 是 千变万化 的 ， 你 可 以 为 XML 字段 设置 一 个 check 约束 以 确保 输入 的 
XML 数据 都 符合 某 种 格式 〈 如 需 了 解 check 约束 的 详细 信息 ， 请 参考 6.2.3 节 的 内 容 )。 示 
例 5-31 中 创建 了 一 个 check 约束 ， 该 约束 要 求 输入 的 XML 数据 中 的 famity 节点 下 都 有 一 
个 relation 节点 。'/family/member/relation' 是 XPath 语法，XPath 是 一 种 能 够 在 xml 树 
状 结构 中 定位 到 指定 元 素 的 语法 。 


示例 5-31: 确保 所 有 XML 字段 记录 中 都 有 至 少 一 个 member 市 点 和 一 个 relation 市 点 


ALTER TABLE families ADD CONSTRAINT chk_has_relation 
CHECK (xpath_exists('/family/member/relation', profile)); 








如 果 我 们 试图 插入 这 样 一 条 记录 : 
INSERT INTO families (profile) VALUES('<family name="HsuO0be"></family>'); 


我 们 会 看 到 这 样 的 报错 信息 : ERROR: new row for relation "families" violates check 
constraint "chk_has_reLation" (错误 : 试图 插入 “families” 表 中 的 新 记录 违反 了 约束 
“chk has _relation” 的 要 求 ) 。 








如 果 需 要 基于 DTD 或 者 XSD 对 XML 数据 进行 格式 检查 ， 你 需要 自行 编写 格式 检查 函 
数 ， 然 后 将 此 函数 放 到 check 约束 中 调用 。PostgreSQL 目前 还 没有 原生 支持 基于 DTD 或 
者 XSD 的 格式 检查 。 





5.7.2 ”查询 XML 数据 


查询 XML 数据 时 ，xpath 函数 会 发 挥 重要 作用 。 该 函数 的 第 一 个 实 参 是 一 个 XPath 查询 
表达 式 ， 第 二 个 实 参 是 一 个 xml 对 象 。 查 询 结 果 是 XPath 查询 语句 所 要 查找 的 XML 元 素 
的 列表 。 示 例 5-32 中 查询 出 了 所 有 的 家 庭 成 员 ， 查 询 中 同时 使 用 了 xpath 和 unnest 函数 ， 
其 中 unnest 函数 用 于 将 数组 转换 成 结果 集 。 这 样 我 们 就 把 一 段 XML 中 的 零碎 信息 提取 出 
来 并 转换 成 了 文本 。 












































示例 5-32: 查询 XML 字段 
SELECT family, 
(xpath('/member/relation/text()', f))[1]::text As relation, 
(xpath('/member/name/text()', f))[1]::text As mem name ©@ 
FROM (SELECT (xpath('/family/@name', profile))[1]::text As fanily, @ 
unnest(xpath('/family/member', profile) 
) As f FROM families) x; © 


family | relation | mem_name 


i et 生 全 于 下 < 
Gomez | padre | Alex 
Gomez | madre | Sonia 
Gomez | hijo | Brandon 
Gomez | hija | Azaleah 


@ 获取 每 个 member 元 素 的 relation 标签 和 name 标签 中 包含 的 文本 元 素 。 此 处 的 语法 中 
必须 加 数组 下 标 ， 因 为 xpath 语法 返回 的 查询 结果 是 数组 类 型 的 ， 即 使 返回 的 数组 中 只 
有 一 个 元 素 也 得 加 下 标 才 能 访问 。 

@ 获取 family 根 节点 的 name 属性 值 。 访 问 属性 值 的 语法 为 @attribute_name。 

日 从 原始 的 XML 文本 块 中 提取 出 所 有 的 member 节点 的 内 容 ， 每 个 member 节点 的 内 容 格 
式 为 <member>、<relation>、</relation>、<name>、</name> 和 </member>。xpath 的 斜 

杠 语 法 表示 要 获取 当前 指定 节点 的 子 节点 的 内 容 。 例 如 ，xpath('/famitLy/member ' ， "pr 

ofile') 将 以 数组 形式 返回 profile 字段 中 family 节点 下 所 有 member 子 节点 的 内 容 。 

xpath('/family/@name'，'profile') 返回 的 是 famity 节点 的 name 属性 的 值 。 默 认 情况 

下 ，xpath 返回 的 是 包含 前 后 标签 部 分 的 完整 节点 内 容 ， 加 了 text() 以 后 ， 返 回 的 就 

是 该 节点 中 包含 的 文本 的 内 容 。 


IAA 渍 ~1s ML ~ 
5.8 自 定 义 数 据 类 型 和 复合 数据 类 型 
本 节 将 为 你 介绍 如 何 定义 和 使 用 自 定义 数据 类 型 。composite (也 称 为 record，row) 常用 
于 构建 需要 转 为 自 定 义 数据 类 型 的 对 象 或 者 是 作为 需要 返回 多 个 字段 的 函数 的 返回 值 类 型 
定义 。 


5.8.1 所 有 表 都 有 一 个 对 应 的 自 定义 数据 类 型 

PostgreSQL 在 建 表 时 会 自动 创建 一 个 与 表 结 构 完全 相同 的 自 定义 数据 类 型 ， 而 且 这 种 
类 型 与 其 他 的 数据 类 型 在 使 用 上 毫 无 区 别 。 可 以 在 建 表 时 指定 某 字段 为 表 类 型 或 者 表 数 
组 类 型 ， 也 就 是 说 可 以 把 一 张 表 的 字段 定义 为 另 一 张 表 。 这 种 将 表层 层 竺 套 的 用 法 与 
“turducken” 很 像 (turducken 即 “特大 哨 ”， 是 turkey-duck-chicken 的 简称 ， 一 种 美食 新 
吃 法 : 将 无 骨 鸡 填 到 无 骨 有 鸭 的 肚子 里 ， 然 后 再 将 填 了 无 骨 鸡 的 无 骨 鸭 填 到 无 骨 火 鸡 的 肚子 
里 ， 这 种 食物 很 好 地 体现 了 多 层 嵌 套 的 关系 )。 在 示例 5-33 中 ， 我 们 将 用 “特大 哺 ” 的 例 
子 来 演示 。 
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示例 5-33: 为 “特大 哨 ” 建 鞠 套 表 
CREATE TABLE chickens (id integer PRIMARY KEY) ; 


CREATE TABLE ducks (id integer PRIMARY KEY, chickens chickens[]); 
CREATE TABLE turkeys (id integer PRIMARY KEY, ducks ducks[]); 


INSERT INTO ducks VALUES (1, ARRAY[ROW(1)::chickens, ROW(1)::chickens]); 
INSERT INTO turkeys VALUES (1, array(SELECT d FROM ducks d)); 











上 面 我 们 直接 在 ducks 表 的 一 条 记录 的 chickens 字段 中 插入 了 两 条 chickens 记录 ， 这 

种 情况 下 这 两 条 记录 的 构造 不 受 chickens 表 定 义 的 约束 ， 因 此 即使 它们 的 主键 重复 也 没 

关系 。 我 们 生成 了 两 条 chickens 记录 ， 填 入 ducks 表 中 ， 然 后 将 这 条 ducks 记录 填 入 到 

turkeys 表 中 ， 这 个 过 程 相当 于 把 两 只 chicken 塞 入 一 只 duck， 然 后 再 把 这 只 duck 塞 入 一 
只 turkey， 跟 制作 “特大 哨 ” 的 过 程 是 完全 一 样 的 。 


最 后 我 们 看 一 下 得 到 的 turkeys 记录 是 什么 样子 的 : 

















SELECT * FROM turkeys; 


output 


1 | {"(1,\"{(1),(1)}\")"} 


嵌 套 表 中 内 瞬 的 表 记 录 是 可 以 进行 修改 的 。 例 如 ， 我 们 要 对 第 一 个 turkey 内 岁 的 第 二 个 
chicken 进行 修改 ， 那 么 可 以 执行 如 下 操作 ; 


UPDATE turkeys SET ducks[1].chickens[2] = ROW(3)::chickens 
WHERE id = 1 RETURNING *; 


1 | {1,\"{(1),(3)}\")"} 


我 们 使 用 RETURNING 子 句 来 返回 本 次 更 新 操作 涉及 的 所 有 记录 ， 我 们 将 在 7.2.9 节 中 介绍 
RETURNING 子 句 的 用 法 。 


PostgreSQL 内 部 维护 着 数据 库 对 象 之 间 的 依赖 关系 。 前 述 ducks 表 的 chickens 字段 依赖 于 
chickens 表 ，turkeys 表 的 ducks 记录 依赖 于 ducks 表 。 要 想 删除 chickens 表 有 两 个 方法 ， 
要 么 在 drop 语句 中 带 上 CASCADE 关键 字 ， 要 么 先 删除 ducks 表 中 的 chickens 字段 。 如 果 使 
用 前 一 个 方法 ， 那 么 ducks 表 的 chickens 字段 会 被 自动 删除 ， 而 且 此 过 程 中 无 告警 信息 。 
相应 地 ，turkeys 表 的 ducks 字段 的 定义 也 将 自动 跟着 改变 。 


























5.8.2 ”构建 自 定 义 数 据 类 型 
尽管 仅仅 通过 建 表 就 可 以 轻松 创建 复合 数据 类 型 ， 但 有 时 候 我 们 仍 会 需要 从 头 开 始 构建 自 
己 的 数据 类 型 。 例 如 ， 使 用 以 下 语句 可 以 构建 一 个 复杂 数字 数据 类 型 





CREATE TYPE compLex_number AS (r double precision, i. double precision); 
可 以 将 此 类 型 作为 字段 类 型 定义 使 用 : 
CREATE TABLE circuits (circuit id serial PRIMARY KEY, ac_volt compLex_number ) ; 
可 以 使 用 如 下 语法 对 这 个 表 进行 查询 : 
SELECT circuit id, (ac_volt).* FROM circuits; 
或 者 这 种 语法 也 可 以 : 
SELECT circuit id, (ac_volt).r, (ac_volt).i FROM circuits; 
你 可 能 会 问 : 上 面 语句 中 ac_volt 外 面 为 什么 要 加 括号 ? 如 果 不 加 的 话 ， 


PostgreSQL 会 报错 说 FROM 子 句 中 找 不 到 ac_vott 这 张 表 。 根 据 这 一 点 就 很 好 
理解 了 ， 加 括号 的 原因 是 为 了 不 让 PostgreSQL 将 其 理解 为 表 名 。 











5.8.3 为 自 定义 数据 类 型 构建 运算 符 和 函数 

在 构建 自 定 义 数据 类 型 后 ， 你 自然 就 会 需要 为 其 创建 相应 的 函数 和 运算 符 。 我 们 接 下 来 
将 演示 如 何 为 complex_number 类 型 创建 一 个 + 运算 符 ， 而 创建 处 理 函 数 的 方法 将 放 在 本 
书后 面 的 第 8 章 中 进行 介绍 。 我 们 在 前 面 已 经 介绍 过 ， 每 个 运算 符 都 有 一 个 底层 实现 函 
数 ， 该 函数 需要 一 个 或 者 两 个 实 参 ， 运 算 符 就 是 这 个 函数 的 符号 化 别名 。 在 PostgreSQL 
官方 手册 的 “创建 运算 符 ” 这 一 节 (http://www.postgresql.org/docs/current/interactive/sql- 
createoperator.html) 中 你 可 以 看 到 系统 允许 使 用 哪些 字符 来 定义 新 的 运算 符 。 




































































运算 符 不 仅仅 是 其 底层 实现 函数 的 别名 ， 它 还 可 以 提供 一 些 可 以 帮助 规划 器 更 好 工作 的 优 
化 信息 ， 规 划 器 借助 这 些 信息 可 以 判定 如 何 使 用 索引 ， 如 何以 最 低 的 成 本 访问 数据 ， 以 
及 哪些 运算 符 表达 式 是 等 价 的 。 这 些 信息 的 完整 列表 以 及 每 一 类 信息 的 具体 作用 可 以 参 
考官 方 手 册 中 “运算 符 的 优化 信息 ”这 一 节 的 内 容 (http://www.postgresql.org/docs/current/ 


interactive/xoper-optimization.html) 。 











创建 运算 符 的 第 一 步 是 创建 其 底层 实现 函数 ， 如 示例 5-34 所 示 。 


示例 5-34: 为 complex_number 创建 底层 实现 函数 
CREATE OR REPLACE FUNCTION add(complex_number, complex_number) RETURNS complex_num 
ber AS 
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$$ 

SELECT ( (COALESCE(($1).r,0) + COALESCE(($2).r,0)), 
(COALESCE(($1).i,0) + COALESCE(($2).i,0)) )::complex_number; 

$$ 

Language sql; 





接 下 来 要 创建 一 个 运算 符 来 代表 此 函数 ， 如 示例 5-35 所 示 。 


示例 5-35: 为 complex_number 类 型 定义 + 运算 符 
CREATE OPERATOR +( 
PROCEDURE = add, 
LEFTARG = complex_number, 
RIGHTARG = complex_number, 
COMMUTATOR = +); 


然后 我 们 测试 一 下 这 个 新 的 + 运算 符 : 
SELECT (1,2)::complex_number + (3,-10)::complex_number; 
输出 结果 是 (4, -8)。 


虽然 我 们 在 此 处 没有 举例 说 明 ， 但 你 可 以 对 函数 和 运算 符 进行 重 载 ， 以 使 其 可 以 接受 多 种 
不 同类 型 的 输入 。 例 如 ， 你 可 以 创建 一 个 支持 complex_number 和 integer 相 加 的 add 函数 
和 相应 的 + 计算 符 ， 这 就 实现 了 对 原 逻 辑 的 扩展 。 








支持 自 定义 数据 类 型 和 运算 符 让 PostgreSQL 从 机 制 上 具有 了 自我 演进 的 能 力 ， 开 源 社区 无 
数 开发 人 员 利 用 此 能 力 为 PostgreSQL 平台 添砖加瓦 ， 随 着 这 个 开发 平台 的 羽翼 日 渐 丰满 ， 
我 们 离 “ 一 切 皆 以 表 驱 动 ”的 理想 境界 也 越 来 越 近 。 























第 6 和 章 





表 、 约 束 和 索引 





表 是 关系 型 数据 库存 储 体系 的 基本 单元 。 设 计 好 结构 化 的 表 并 且 定 义 表 与 表 之 间 的 关联 关 
系 是 关系 型 数据 库 的 核心 设计 思想 。 在 PostgreSQL 中 ， 约 束 定义 了 表 与 表 之 间 的 关系 。 与 





以 堆 结 构 存 储 的 记录 相 比 ， 表 的 优势 就 在 于 有 索引 。 你 会 如 





E 很 多 








区 的 末尾 看 到 词 ; 


[索引 





表 ， 也 会 在 写字 楼 入 口 大 堂 处 看 到 每 层 楼 的 租户 名 单 ， 表 索引 的 作用 与 它们 是 类 似 的 ， 即 























在 表 中 快速 查找 到 目标 数据 的 位 置 ， 这 样 你 就 可 以 不 用 每 次 查询 时 都 扫描 上 整 张 表 的 内 容 。 


本 章 中 ， 我 们 将 介绍 建 表 和 插入 记录 的 语法 。 然 后 将 介绍 约束 的 用 法 ， 约 束 可 以 保证 数据 
库 的 记录 不 会 违反 我 们 制定 的 规则 。 最 后 我 们 将 向 你 展示 如 何 为 表 创建 索引 来 加 速 查询 。 
在 表 上 建 索 引 是 需要 经 过 深思 熟 虑 的 ， 因 为 一 个 错误 的 索引 会 导致 查询 效果 比 全 表 扫 摘 还 


慢 ， 也 就 是 说 建 了 还 不 如 不 建 。 并 不 是 所 有 的 索引 都 是 “生来 平等 ”的 ， 数 据 库 领 域 的 算 
法 专家 们 为 不 同 的 数据 类 型 设计 出 了 不 同类 型 的 索引 ， 目 的 是 将 查询 的 速度 提升 到 极致 。 





6.1 表 





除了 普通 的 表 以 外 ，PostgreSQL 还 提供 了 许多 不 常见 的 表 ， 有 具体 包括 : 临时 表 、 无 日 志 
表 、 继 承 表 、 基 于 复合 类 型 的 表 以 及 外 部 表 (我 们 将 在 第 10 章 中 介绍 外 部 表 ) 。 


6.1.1 基本 的 建 表 操作 





示例 6-1 演示 了 建 表 语 法 ， 在 所 有 支持 SQL 的 数据 库 中 建 表 语 法 都 是 类 似 的 。 


示例 6-1: 基本 的 建 表 操作 


CREATE TABLE Logs ( log_id serial PRIMARY KEY, @ user_name varchar(50), @ descrip 
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tion text, @ Log_ts timestamp with time zone NOT NULL DEFAULT current_timestamp ) ; 
@ 
CREATE INDEX idx_logs_log ts ON Logs USING btree (log_ts); 


@ serial 数据 类 型 是 一 种 自 增长 的 数字 类 型 。 建 表 时 如 果 有 一 个 serial 类 型 的 字段 ， 那 
么 系统 会 自动 在 schema 中 同时 创建 一 个 对 应 的 序列 号 生成 器 。serial 类 型 字段 的 值 是 
一 个 整 型 数字 ， 它 会 自动 被 赋值 为 序列 号 生成 器 的 下 一 个 值 。 每 张 表 一 般 来 说 只 会 
一 个 serial 字段 ， 且 一 般 是 用 作 主 键 。 

@ varchar 是 character varying (可 变 长 字符 串 ) 的 简写 ， 其 定义 与 其 他 数据 库 产品 中 的 
定义 是 类 似 的 。 你 可 以 不 为 varchar 字段 设 定 最 大 长 度 值 ， 此 时 它 与 text 类 型 几乎 是 
一 样 的 。 

@ text 是 一 种 不 定 长 度 的 字符 串 ， 无 最 大 长 度 限制 。 

@ timestamp with time zone (可 简写 为 timestamptz) 是 一 种 表示 日 期 和 时 间 的 类 型 ， 总 
是 以 国际 标准 时 间 (UTC) 格式 存储 。 该 类 型 在 显示 时 总 是 以 服务 器 当前 所 在 时 区 为 
基准 进行 显示 ， 当 然 你 也 可 以 要 求 使 用 指定 的 时 区 进行 显示 。 更 多 关于 此 类 型 的 讨论 ， 
请 参考 5.3.1 节 。 









































6.1.2 ”继承 表 


PostgreSQL 是 唯一 提供 表 继 承 功 能 的 数据 库 。 如 果 创建 一 张 表 ( 子 表 ) 时 指定 为 继承 

自 另 一 张 表 ( 父 表 )， 则 建 好 的 子 表 除了 含有 自己 的 字段 外 还 会 含有 父 表 的 所 有 字段 。 

PostgreSQL 会 记录 下 这 个 继承 关系 ， 这 样 一 旦 父 表 的 结构 发 生 了 变化 ， 子 表 的 结构 也 会 自 

动 跟着 变化 。 这 种 父子 继承 结构 的 表 可 以 完美 地 适用 于 需要 数据 分 区 的 场景 。 当 查询 父 表 

时 ，PostgreSQL 会 自动 把 子 表 的 记录 也 取出 来 。 值 得 注意 的 是 ， 并 不 是 所 有 父 表 的 特征 都 

会 被 子 表 继承 下 来 ， 比 如 主 表 的 主键 约束 、 唯 一 性 约束 以 及 索引 就 不 会 被 继承 。Check 约 
会 被 继承 ， 但 子 表 还 可 以 另 建 自己 的 check 约束 〈 详 见 示例 6-2)。 


示例 6-2: 创建 继承 表 
CREATE TABLE logs 2011 (PRIMARY KEY(Log_id)) INHERITS(Logs); 
CREATE INDEX idx_Logs_2011_Log_ts ON Logs USING btree(Log_ts ) ; 
ALTER TABLE Logs_2011 ADD CONSTRAINT chk_y2011 
CHECK (Log_ts >= '2011-1-1'::timestamptz 
AND Log_ts < '2012-1-1'::timestamptz ); © 


























@ 我 们 定义 了 一 个 check 约束 来 限制 只 能 录入 2011 年 的 数据 。 该 check 约束 告诉 查询 规 
划 器 在 查询 父 表 时 跳 过 条 件 不 满足 的 子 表 。 








6.1.3 无 日 志 表 
对 于 发 生 磁盘 故障 或 者 系统 月 浇 后 可 以 被 重建 的 临时 数据 来 说 ， 其 操作 速度 比 可 靠 性 更 重 
要 。PostgreSQL 从 9.1 版 开始 支持 UNLOGGED 修饰 符 ， 使 用 该 修饰 符 可 以 创建 无 日 志 的 表 ， 
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如 示例 6-3 所 示 。 系 统 不 会 为 这 种 表 记 录 任 何事 务 日 志 (业界 一 般 也 称 为 WAL 日 志 ， 即 
write-ahead log)。 如 果 你 的 服务 器 经 历 了 一 次 掉 电 重启 ， 那 么 无 日 志 表 中 的 数据 会 在 事务 
回 滚 过 程 中 被 全 部 清除 掉 。 你 可 以 从 Depesz 站 点 的 “等 待 9.1 版 的 无 日 志 表 ”这 篇 博文 
(http://www.depesz.com/2011/01/03/waiting-for-9-1-unlogged-tables/) 中 看 到 更 多 示例 和 使 用 
注意 事项 。 





























另外 在 pg_dump 中 还 有 一 个 选项 可 以 设置 在 备份 时 跳 过 无 日 志 表 。 
示例 6-3: 创建 无 日 志 表 


CREATE UNLOGGED TABLE web_sessions ( session_id text PRIMARY KEY，add_ts time 
stamptz, upd_ts timestamptz，sesston_state xml); 
无 日 志 表 的 一 大 优势 就 是 对 其 写 入 数据 要 远 远 快 于 往 普 通 表 中 写 数据 。 按 照 我 们 的 经 验 ， 
一 般 要 快 大 约 15 倍 。 请 牢记 使 用 无 日 志 表 的 缺点 。 


。 如 果 数 据 库 服务 器 崩溃 ，PostgreSQL 将 截断 所 有 无 日 志 表 (截断 的 意思 是 擦 除 所 有 行 )。 
。 无 日 志 表 不 支持 GiST 索引 (6.3.1 市 会 讨论 此 索引 类 型 )， 因 此 它 就 不 适用 于 依赖 GiST 
索引 的 数据 类 型 。 


但 无 日 志 表 上 可 以 建 常 用 的 B- 树 索 引 和 GIN 索引 。 





6.1.4 TYPE OF 

PostgreSQL 在 创建 一 张 表 时 ， 会 自动 在 后 台 创 建 一 个 结构 完全 相同 的 复合 数据 类 型 ， 反 之 
则 不 是 这 样 。 在 9.0 版 中 ， 你 可 以 使 用 一 个 复合 数据 类 型 来 作为 建 表 的 模板 。 以 下 我 们 将 
演示 该 功能 ， 首 先 创 建 一 个 复合 数据 类 型 。 








CREATE TYPE basic_user AS (user_name varchar(50), pwd varchar(10)); 





然后 我 们 可 以 使 用 OF 语法 来 创建 一 张 表 ， 表 结构 就 是 该 复合 类 型 ， 如 示例 6-4 所 示 。 
示例 6-4: 以 复合 数据 类 型 为 模板 来 创建 一 张 表 


CREATE TABLE super_users OF basic user (CONSTRAINT pk_su PRIMARY KEY (user_name)); 











当 基 于 数据 类 型 来 创建 表 时 ， 你 不 能 指定 表 字 段 的 定义 ， 一 切 以 数据 类 型 本 身 的 定义 为 
准 。 然 而 ， 为 复合 数据 类 型 新 增 或 者 移 除 字段 时 ，PostgreSQL 会 自动 修改 相应 的 表 结 构 。 
这 种 机 制 的 优点 是 ， 如 果 你 的 系统 中 有 很 多 结构 相同 的 表 ， 而 你 可 能 会 需要 同时 对 所 有 表 
结构 进行 相同 的 修改 ， 那 么 此 时 只 需要 修改 此 基础 数据 类 型 即 可 ， 这 一 点 与 表 继 承 机 制 很 
相似 。 














例如 我 们 需要 为 示例 6-4 中 定义 的 super_users 表 增 加 一 个 电话 号 码 字 段 ， 那 么 只 需要 修 
改建 表 时 所 使 用 的 数据 类 型 即 可 。 
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ALTER TYPE basic_user ADD ATTRIBUTE phone varchar(10) CASCADE; 


通常 ， 如 有 果 表 依赖 于 某 个 类 型 ， 那 么 你 就 不 能 更 改 该 类 型 的 定义 。CAsSCADE 修饰 符 凌 驾 于 
此 限制 之 上 ， 对 所 有 相关 表 应 用 相同 的 更 改 。 


6.2 ”约束 机 制 


PostgreSQL 的 约束 机 制 是 我 们 所 接触 过 的 数据 库 中 最 先进 的 〈 同 时 也 是 最 复杂 的 )。 用 户 
可 以 在 创建 约束 时 定制 其 各 方面 的 属性 ， 包 括 约 束 的 名 称 、 如 何 处 理 现 有 数据 、 级 联 生 效 
条 件 选 项 、 如 何 执行 匹配 算法 、 使 用 哪些 索引 以 及 在 何 种 情况 下 约束 可 以 不 生效 等 。 关 于 
完整 的 约束 规则 ， 我 们 建议 你 查阅 PostgreSQL 官方 手册 (http://www.postgresql.org/docs/ 
current/interactive/sql-set-constraints.html) 中 的 相关 内 容 。 虽 然 约 束 机 制 中 有 大 量 的 选项 可 
供 定 制 ， 但 一 般 来 说 没 那 么 复杂 ， 采 用 默认 选项 就 够 了 。 我 们 将 从 几 个 关系 型 数据 库 领 域 
耳熟能详 的 概念 开始 为 你 介绍 ， 包 括 : 外 键 约束 、 唯 一 性 约束 以 及 check 约束 。 然 后 我 们 
再 介绍 从 PostgreSQL 9.0 版 开始 引入 的 排他 性 约束 。 




















主键 约束 和 字段 唯一 性 约束 在 表 级 范围 内 不 允许 出 现 重 名 。 一 般 的 做 法 是 把 
表 名 和 字段 名 加 入 到 约束 的 名 称 中 ， 这 样 就 不 会 重复 。 为 简洁 起 见 ， 我 们 下 
面 的 例子 中 可 能 不 会 遵循 这 种 做 法 。 








6.2.1 外 键 约束 

与 大 多 数 支持 引用 完整 性 的 数据 库 一 样 ，PostgreSQL 遵循 与 其 相同 的 约定 。 你 可 以 指定 级 
联 更 新 和 删除 规则 以 避免 出 现 讨厌 的 孤立 记录 。 下 面 我 们 将 在 示例 6-5 中 展示 如 何 添加 外 
键 约束 。 


示例 6-5: 建立 外 键 约 束 和 相应 的 索引 
set search_ path=censuyus, public; 
ALTER TABLE facts ADD CONSTRAINT fk_facts 1 FOREIGN KEY (fact_ type_id) 
REFERENCES Lu_fact_types (fact_type_id) © 
ON UPDATE CASCADE ON DELETE RESTRICT; @ 
CREATE INDEX fki_facts_1 ON facts (fact_type_id); © 








@ 我 们 在 facts 表 和 Lu_fact_types 表 之 间 定 义 了 一 个 外 键 约束 关系 。 有 了 这 个 约束 以 
后 ， 如 果 主 表 tu_fact_types 中 不 存在 某 fact_type_id 的 记录 ， 那 么 从 表 fact 中 就 不 
能 插入 该 fact_type_id 的 记录 。 

@ 我 们 定义 了 一 个 级 联 规则 ， 实 现 了 以 下 功能 : (1) 如 果 主 表 Lu_fact_type 的 fact_ 
type_id 字段 值 发 生 了 变化 ， 那 么 从 表 fact 中 相应 记录 的 fact_type_id 字段 值 会 自动 
进行 相应 修改 ， 以 维持 外 键 引用 关系 不 变 ，(2) 如 果 从 表 fact 中 还 存在 某 fact_type_ 
id 字段 值 的 记录 ， 那 么 主 表 Lu_fact_type 中 相同 fact_type_id 字段 值 的 记录 就 不 允许 








被 删除 。ON DELETE RESTRICT 是 默认 行为 模式 ， 也 就 是 说 这 个 子 名 不 加 也 可 以 ， 但 我 们 
建议 为 了 清晰 起 见 最 好 是 加 上 。 

@ PostgreSQL 在 建立 主键 约束 和 唯一 性 约束 时 ， 会 自动 为 相应 字段 建立 索引 ， 但 在 建立 
外 键 约束 时 却 不 会 ， 这 一 点 需要 注意 。 你 需要 为 外 键 字段 手动 建立 索引 以 加 快 关联 引 
用 时 的 查询 速度 。 


6.2.2 ”唯一 性 约束 

主键 字段 的 值 是 唯一 的 ， 但 每 张 表 只 能 定义 一 个 主键 ， 因 此 如 果 你 需要 保证 别 的 字段 值 唯 
一 ， 那 么 必须 在 该 字段 上 建立 唯一 性 约束 或 者 说 唯一 索引 。 建 立 唯 一 性 约束 时 会 自动 在 后 
台 创 建 一 个 相应 的 唯一 索引 。 与 主键 字段 类 似 ， 建 立 了 唯一 性 约束 的 字段 不 允许 为 空 ， 并 
且 可 以 作为 外 键 字段 被 别 的 表 引 用 。 不 过 请 注意 : 建 了 唯一 索引 但 却 没 有 唯一 性 约束 的 字 
段 是 可 以 输入 空 值 的 。 下 面 的 例子 演示 了 如 何 建 一 个 唯一 索引 。 




































































ALTER TABLE Logs_2011 ADD CONSTRAINT uq UNIQUE (user_name ,Log_ts); 


此 导 











你 可 能 经 常会 遇 到 仅 需 要 保证 表 中 部 分 记录 行 唯 一 的 情况 ，PostgreSQL 不 支持 神 
条 件 的 唯一 性 约束 ， 但 你 可 以 通过 使 用 唯一 性 的 部 分 索引 来 达到 相同 目的 。 详 情 ii 
6.3.4 节 。 
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6.2.3 check 约束 

check 约束 能 够 对 表 的 一 个 或 者 多 个 字段 加 上 一 个 条 件 ， 表 中 每 一 行 记录 必须 满足 此 条 件 。 
查询 规划 器 也 会 利用 check 约束 来 优化 执行 速度 ， 比 如 有 些 查 询 附 带 的 条 件 与 待 查 询 表 的 
check 约束 无 交集 ， 那 么 规划 器 会 立即 认定 该 查询 未 命中 目标 并 返回 。 示 例 6-2 中 就 有 一 
个 check 约束 ， 该 约束 可 以 告诉 规划 器 不 要 试图 查找 不 符合 约束 条 件 的 记录 。check 约束 
支持 基于 国 数 和 布尔 表达 式 的 条 件 ， 因 此 你 可 以 发 挥 创 意 编写 出 一 个 非常 复杂 的 约束 条 件 
来 。 例 如 ， 以 下 check 约束 可 以 限制 Logs 表 中 所 有 用 户 名 必须 都 小 写 : 




















ALTER TABLE Logs ADD CONSTRAINT chk CHECK(user_name = lower(user_name)); 











特别 值得 注意 的 一 点 是 ， 当 表 间 存在 继承 关系 时 ， 子 表 会 继承 父 表 的 check 约束 ， 但 主键 、 
外 键 、 唯 一 性 这 三 种 约束 却 不 会 继承 。 


6.2.4 ”排他 性 约束 

传统 的 唯一 性 约束 在 比较 算法 中 仅 使 用 了 “等 于 ”运算 符 ， 即 保证 了 指定 字段 的 值 在 本 
表 的 任意 两 行 记录 中 都 不 相等 ， 而 9.0 版 中 引入 的 排他 性 约束 机 制 拓展 了 唯一 性 比较 算 
法 机 制 ， 可 以 使 用 更 多 的 运算 符 来 进行 比较 运算 ， 该 类 约束 特别 适用 于 解决 有 关 时 间 安 
排 的 问题 。 
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PostgreSQL 9.2 版 中 引入 了 区 间 数 据 类 型 ， 该 类 型 特别 适合 使 用 排他 性 约束 。 你 可 
以 在 depesz 站 点 的 “等 待 92 版 支持 区 间 数 据 类 型 ”这 篇 博文 (http://www.depesz. 
com/2011/11/07/waiting-for-9-2-range-data-types/) 中 找到 在 区 间 数 据 类 型 上 使 用 排他 性 约束 
的 非常 好 的 例子 。 





排他 性 约束 一 般 是 基于 GiST 类 型 的 索引 来 实现 ， 使 用 基于 B- 树 算法 的 GiST 多 列 复合 索 
引 也 是 可 以 的 。 不 过 需要 先 安装 btree_gist 扩展 包 才 能 建立 这 种 索引 。 多 列 排 他 性 约束 的 
一 个 经 典 应 用 场景 就 是 用 于 安排 资源 。 


以 下 是 一 个 使 用 排他 约束 的 例子 。 假 设 你 的 办 公 场 所 有 固定 数量 的 会 议 室 ， 各 项 目 组 在 使 

会 议 室 前 必须 预定 。 示 例 6-6 演示 了 如 何 避 免 发 生 预 定 冲突 。 该 示例 中 使 用 了 (8&&) 运 
算 符 来 判定 时 间 区 段 是 否 重合 ,还 使 用 了 (=) 运算 符 来 判定 会 议 室 房 间 号 是 否 重复 ， 请 
注意 观察 和 思考 此 用 法 。 








示例 6-6: 防止 会 议 室 预 定 冲 突 
CREATE TABLE schedules(id serial primary key, room smallint, time_slot tstzrange); 
ALTER TABLE schedules ADD CONSTRAINT ex_schedules 
EXCLUDE USING gist (room NITH =, time_slot WITH &&); 





同 唯 一 性 约束 一 样 ，PostgreSQL 会 自动 为 排他 性 约束 中 涉及 的 字段 建立 索引 。 


6.3 索引 


PostgreSQL 的 索引 机 制 功能 强大 、 特 性 丰富 ， 仅 仅 索 引 部 分 的 内 容 已 足够 写 一 本 大 部 
头 的 书 。 本 书写 作 之 时 ，PostgreSQL 已 支持 至 少 四 种 类 型 的 索引 。 如 果 你 觉得 还 不 够 ， 
PostgreSQL 还 允许 你 为 这 几 种 索引 类 型 自 定义 新 的 索引 运算 符 和 修饰 符 以 作为 其 功能 补 
充 。 如 有 果 这 样 还 不 能 满足 你 的 要 求 ， 你 可 以 创建 自己 的 索引 类 型 。 




















PostgreSQL 还 支持 在 同一 张 表 中 混合 搭配 不 同 的 索引 类 型 ， 且 预计 规划 器 将 综合 考虑 所 有 
的 索引 。 例 如 ， 在 一 个 字段 上 建立 B- 树 索 引 ， 在 旁边 的 字段 上 建立 GiST 索引 ， 查 询 时 
两 个 索引 都 可 以 被 用 上 。 要 更 深入 了 解 规划 器 对 索引 的 选用 机 制 ， 请 参考 PostgreSQL 官 
方 手 册 中 “位 图 索引 扫描 策略 ”这 一 节 (http://www.postgresql.org/docs/current/interactive/ 
indexes-bitmap-scans.html) 的 内 容 。 








同一 张 表 上 的 索引 名 不 允许 重复 。 








6.3.1 ” PostgreSQL 原生 支持 的 索引 类 型 
要 想 利 用 好 PostgreSQL 的 索引 能 力 ， 我 们 需要 先 了 解 其 支持 的 不 同 的 索引 类 型 以 及 它们 各 
自 适用 于 什么 场景 。 索 引 方 法 包括 以 下 几 种 。 














。 B- 树 索引 
B- 树 是 一 种 关系 型 数据 库 中 常见 的 通用 索引 类 型 。 如 果 你 对 别 的 索引 类 型 不 感 兴趣 ， 
那么 一 般 使 用 B- 树 索 引 就 可 以 了 。 有 的 场景 下 PostgreSQL 会 自动 创建 索引 (比如 创建 
主键 约束 或 者 唯一 性 约束 时 ) ， 那 么 创建 出 来 的 索引 就 是 B- 树 类 型 的 ， 如 果 你 自己 创建 
索引 时 未 指定 索引 类 型 ， 那 么 默认 也 会 创建 B- 树 类 型 的 索引 。 主 键 约束 和 唯一 性 约束 
唯一 支持 的 后 台 索 引 就 是 B- 树 索 引 。 





























。 GiST 索 引 
GiST 的 全 称 是 Generalized Search Tree， 意 即 通用 搜索 树 。 它 主要 的 适用 场 
景 包 括 全 文 搜 索 以 及 空间 数据 、 科 学 数据 、 非 结构 化 数据 和 层次 化 数据 的 搜 
索 。 该 类 索引 不 能 用 于 保障 字段 的 唯一 性 ， 也 就 是 说 建立 了 该 类 型 索引 的 字段 
上 可 播 入 重复 值 ， 但 如 果 把 该 类 索引 用 于 排他 性 约束 就 可 以 实现 唯一 性 保障 。 
GiST 是 一 种 有 损 索 引 ， 也 就 是 说 它 不 存储 被 索引 字段 的 值 ， 而 仅仅 存储 字段 值 的 一 个 
取样 ， 这 种 取样 是 失真 的 ， 就 像 把 一 个 盒子 变 成 了 一 个 多 边 形 。 这 就 意味 着 需要 一 个 额 
外 的 查找 步骤 以 获得 真正 记录 的 值 。 


























。 GIN 索 引 

GIN 的 全 称 是 Generalized Inverted Index (GIN)， 即 通用 逆序 索引 。 它 主要 适用 于 
PostgreSQL 内 置 的 例文 搜索 引擎 以 及 jsonb 数据 类 型 。 其 他 有 一 些 扩展 包 比 如 hstore 和 
pg_trgm 也 会 使 用 这 种 索引 。GIN 其 实 是 从 GiST 派生 出 来 的 一 种 索引 类 型 ， 但 它 是 无 
损 的 ， 也 就 是 说 索引 中 会 包含 有 被 索引 字段 的 值 。 如 果 你 需要 查询 的 字段 都 已 被 索引 ， 
那么 只 读 取 索 引 即 可 获取 查询 结果 ， 这 种 情况 下 GIN 的 查询 速度 是 快 于 GiST 的 。 然 
而 ， 由 于 GIN 比 GiST 在 更 新 操作 时 要 多 出 一 个 字段 值 复制 动作 ， 因 此 此 时 是 GiST 索 
引 更 快 一 些 。 另 外 ，GIN 的 索引 树 内 部 每 一 个 索引 行 的 长 度 是 有 限制 的 ， 所 以 它 不 能 
用 于 对 hstore 文档 或 者 text 等 大 对 象 类 型 进行 索引 。 如 果 你 需要 把 一 个 600 页 的 手册 
内 容 存 入 一 张 表 的 某 个 字段 ， 那 么 绝对 不 要 在 该 字段 上 建 GIN 类 型 的 索引 。 在 “等 待 
更 快 的 LIKE/ILIKE 运算 符 ”(http://www.depesz.com/2011/02/19/waiting-for-9-1-faster- 
likeilike/) 这 篇 博文 中 有 一 个 关于 GIN 用 法 的 非常 好 的 例子 可 供 你 参考 。 在 9.3 版 中 ， 
用 于 实现 字符 串 模 糊 匹 配 和 相似 度 查询 的 pg_trgm 扩展 包 中 做 了 一 个 功能 强化 : 支持 正 
则 表达 式 条 件 查询 时 用 上 GIN 索引 ， 这 大 大 增加 了 pg_trgm 的 适用 场景 。 





















































。 SP-GiST 索 引 
SP-GiST 是 指 基 于 空间 分 区 树 (Space-Partitioning Trees) 算法 的 GiST 索引 。 该 类 型 的 
索引 从 9.2 版 开始 引入 ， 与 GiST 索引 适用 领域 相同 ， 但 对 于 某 些 特定 领域 的 数据 算法 ， 
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其 效率 会 更 高 一 些 。PostgreSQL 的 point 和 box 等 原生 几何 类 型 以 及 text 类 型 是 最 先 
支持 该 类 索引 的 数据 类 型 。 从 9.3 版 开始 ， 区 间 类 型 也 开始 支持 此 类 型 的 索引 。PostGIS 
扩展 包 也 有 计划 要 在 近期 开始 用 上 此 类 索引 以 提升 性 能 。 


。 哈 希 索引 
哈 希 索引 在 GiST 和 GIN 索引 出 现 前 就 已 经 得 到 了 广泛 使 用 。 业 界 普 遍 认为 GiST 和 
GIN 索引 在 性 能 和 事务 安全 性 方面 要 胜 过 哈 希 索引 。 请 注意 : 事务 日 志 中 不 会 记录 哈 
希 索 引 的 变化 ， 那 么 在 流 式 复制 环境 中 就 不 能 使 用 哈 希 索引 ， 否 则 会 导致 修改 无 法 被 同 
步 。PostgreSQL 已 将 哈 希 索引 列 为 不 推荐 使 用 状态 。 在 别 的 数据 库 中 你 可 能 仍 会 见 到 
该 索引 类 型 ， 但 在 PostgreSQL 中 最 好 避免 使 用 它 。 























。 基于 B- 树 算法 的 GiST 和 GIN 索 引 

如 果 你 想 了 解 PostgreSQL 除了 默认 特性 以 外 还 有 哪些 功能 ， 不 管 是 出 于 业务 需要 或 者 是 
仅仅 出 于 好 奇 心 ， 都 可 以 从 了 解 基 于 B- 树 算法 的 GiST 和 GIN 索引 开始 。 这 两 种 复合 索 
引 非常 具有 代表 性 ， 而 且 二 者 都 是 以 扩展 包 形 式 存 在 的 ， 因 此 也 比较 便于 学 习 和 研究 。 
这 两 类 混合 算法 索引 的 优势 在 于 ， 它 们 一 方面 能 够 支持 GiST 和 GIN 索引 特有 的 运算 符 ， 
同时 又 具有 B- 树 索引 对 于 “等 于 ”运算 符 的 良好 支持 。 有 时 我 们 会 需要 建立 这 样 的 多 
列 复合 索引 : 索引 字段 中 既 有 像 character varying 或 number 这 样 的 数据 类 型 ， 又 有 层 
次 化 的 ttree 类 型 或 者 用 于 全 文 搜索 的 vector 类 型 。 前 两 种 数据 类 型 一 般 会 使 用 “等 
于 ”运算 符 来 进行 操作 ， 后 两 种 一 般 使 用 GIN/GiST 索引 提供 的 运算 符 进行 操作 。 此 时 
你 会 发 现 要 建立 这 种 索引 必须 使 用 基于 B- 树 算法 的 GiST 或 者 基于 B- 树 算 法 的 GIN。 
























































6.3.2 ”运算 符 类 

其 实 我 们 非常 希望 能 够 跳 过 这 部 分 关于 “运算 符 类 ”的 内 容 ， 因 为 很 多 幸运 的 人 即使 不 知 
道 “ 运 算 符 类 ”是 什么 以 及 它 与 索引 有 什么 关系 也 能 毫 无 障碍 地 使 用 索引 。 但 如 果 你 运气 
没 这 么 好 ， 也 就 是 说 你 的 应 用 场景 需要 你 了 解 这 些 内 容 ， 那 么 就 得 对 运算 符 类 好 好 研究 
了 ， 否 则 就 会 一 直 被 这 个 问题 困扰 :“ 为 什么 规划 器 没 用 上 我 的 索引 1? ” 


各 种 数据 类 型 均 有 其 自身 特点 ， 因 此 适用 的 索引 类 型 不 同 ， 会 用 到 的 比较 运算 符 也 不 同 。 
例如 ， 对 于 基于 区 间 类 型 (range) 的 索引 来 说 ， 最 常用 的 运算 符 是 重 县 运算 符 (&&)， 然 
而 该 运算 符 对 于 快速 本 文 搜索 领域 来 说 却 之 无 意义 。 对 于 中 文 这 类 表意 文字 来 说 ， 建 立 的 
索引 基本 上 不 会 用 到 “不 等 于 ”运算 符 ， 而 对 英文 这 类 表 音 文字 建立 索引 时 ,字母 A 到 Z 
的 排序 操作 是 不 可 或 缺 的 。 


基于 以 上 特点 ，PostgreSQL 把 一 类 应 用 领域 相近 的 运算 符 以 及 这 些 运 算 符 适 用 的 数据 类 型 
组 合 在 一 起 称 为 一 个 运算 符 类 (简称 opclass)。 例 如 ，int4_ops 运算 符 类 包含 适用 于 int4 
类 型 的 = < > > < 运算 符 。PostgreSQL 提供 了 一 张 叫 作 pg_class 的 系统 表 ， 从 中 可 以 查 到 
完整 的 运算 符 类 列表 ， 其 中 既 包 含 了 系统 原生 支持 的 类 ， 也 包含 了 通过 扩展 包机 制 添加 的 





















































类 。 一 种 类 型 的 索引 会 使 用 特定 的 若干 种 运算 符 类 。 完 整 的 运算 符 列表 可 以 从 pgAdmin 界 
面 上 的 运算 符 类 目下 看 到 ， 也 可 以 根据 system catalog 在 示例 6-7 中 执行 查询 得 到 。 


示例 6-7: 查询 B- 树 索 引 支 持 的 数据 类 型 以 及 运算 符 类 
SELECT am.amname AS index_method, opc.opcname AS opclass_name, 
opc.opcintype: :regtype AS indexed_type, opc.opcdefault AS is_default 
FROM pg_am am INNER JOIN pg_opclass opc ON opc.opcmethod = am.oid 
WHERE am.amname = 'btree' 
ORDER BY index_method, indexed_type, opclass_name; 


index_method | opclass_name | indexed_type | is_default 
------------- 和 
btree | booL_ops | boolean LI 志 
btree | text_ops | text | 七 
btree | text_pattern_ops | text | 本 
btree | varchar_ops | text | f 

| varchar_pattern_ops | text | f 





在 示例 6-7 中 ， 仅 查询 了 B- 树 的 相关 数据 。 请 注意 ， 每 类 索引 都 会 有 多 个 运算 符 类 ， 而 


其 中 仅 有 一 个 会 被 标记 为 默认 运算 符 类 。 如 有 果 建 立 索 引 时 未 指定 使 用 哪个 运算 符 类 ， 那 么 
PostgreSQL 默认 会 使 用 默认 运算 符 类 。 绝 大 多 数 情况 下 这 么 做 是 没什么 问题 的 ， 但 并 非 绝 


对 如 此 。 


例如 ，B- 树 索引 默认 的 text_ops 运算 符 类 (又 名 varchar_ops) 中 并 不 支持 ~~ 运算 符 
( 即 LIKE 运算 符 )， 所 以 如 果 建 B- 树 索 引 时 选择 了 该 运算 符 类 ， 那 么 所 有 使 用 LIKE 的 查 
询 都 无 法 在 text_ops 运算 符 类 中 使 用 索引 。 因 此 ， 如 果 你 的 业务 场景 需要 对 varchar 或 者 
text 类 型 进行 大 量 LIKE 模糊 查询 ， 那 么 建 索 引 时 最 好 是 显 式 指定 使 用 text_pattern_ops 
或 者 varchar_pattern_ops 这 两 个 运算 符 类 。 指 定 运算 符 类 的 语法 很 简单 ， 只 需要 在 建 索 








引 时 加 在 被 索引 字段 名 的 后 面 即 可 ， 参 考 示例 如 下 : 


CREATE INDEX idx1 ON census.Lu_tracts USING btree (tract_name text_pattern_ops); 








varchar_ops 貌似 有 点 名 不 副 实 。 这 是 因为 varchar 类 型 本 质 上 就 
度 限制 的 text 类 型 ， 二 者 可 以 共用 一 套 运 算 符 。varchar_ops 逢 








在 上 述 示例 6-7 的 查询 结果 中 ， 你 可 能 已 经 注意 到 了 B- 树 索 引 的 varchar_ 
ops 和 text_ops 两 种 运算 符 类 适用 的 数据 类 型 都 是 text， 这 样 来 看 的 话 ， 





i 是 加 了 长 


Hvarchar_ 


pattern_ops 实质 上 就 是 text_ops 和 text_pattern_ops 的 别名 ， 之 所 以 把 前 








面 两 种 单列 出 来 是 因为 varchar 毕竟 是 单独 的 一 种 数据 类 型 ， 存 在 一 种 以 其 














类 型 命名 的 专属 运算 符 类 看 起 来 会 比较 合理 。 

















最 后 请 牢记 这 一 条 : 你 创建 的 每 一 个 索引 都 只 会 使 用 一 个 运算 符 类 。 如 有 果 和 希望 一 个 字段 上 
的 索引 使 用 多 个 运算 符 类 ， 那 么 请 创建 多 个 索引 。 要 将 默认 索引 text_ops 添加 到 表 中 ， 请 
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运行 以 下 代码 : 


CREATE INDEX idx2 ON census.Lu_tracts USING btree (tract_name ) ; 





现在 ， 在 同一 个 字段 上 就 有 了 多 个 索引 (单个 字段 上 可 建立 索引 的 个 数 是 没有 限制 的 )。 
规划 器 处 理 等 值 查询 时 会 使 用 idx2， 处 理 tike 模糊 查询 时 会 使 用 idx1。 

















你 可 以 在 PostgreSQL 官方 手册 中 找到 关于 运算 符 类 的 更 详细 的 描述 (http://www. 
postgresql.org/docs/current/interactive/indexes-opclass.html)。 另 外 我 们 也 强烈 建议 你 阅读 
一 下 我 们 的 博客 文章 “为 什么 我 的 索引 没 发 挥 作 用 ? ”(http://www.postgresonline.com/ 


journalarchives/78-Why-is-my-index-not-being-used.html) 。 





6.3.3 ” 通 数 索引 

PostgreSQL 的 函数 索引 功能 可 以 基于 字段 值 的 函数 运算 结果 建立 索引 。 函 数 索 引 的 用 途 也 
是 很 广泛 的 ， 例 如 可 用 于 对 大 小 写 混 杂 的 文本 数据 建立 索引 。PostgreSQL 是 一 个 区 分 大 小 
写 的 数据 库 ， 如 果 要 实现 不 区 分 大 小 写 的 查询 ， 那 么 可 以 借助 如 下 的 函数 索引 |: 
































CREATE INDEX fidx ON featnames_short 
USING btree (upper(fullname) varchar_pattern_ops); 





建立 了 该 索引 之 后 ， 类 似 SELECT fullname FROM featnames_short WHERE upper(fullname) 
LIKE 'S%' 这 种 查询 就 可 以 用 上 索引 了 。 不 过 要 注意 ， 查 询 语句 中 使 用 的 国 数 要 与 建国 数 
索引 时 使 用 的 函数 完全 一 致 ， 这 样 才 能 保证 用 上 索引 。PostgreSQL 和 Oracle 都 支持 函数 索 
引 。MySQL 和 SQL Server 不 直接 支持 函数 索引 ， 但 提供 了 自动 计算 字段 并 且 可 以 对 该 类 
字段 建立 索引 ， 总 的 来 说 其 效果 和 函数 索引 是 类 似 的 。 从 9.3 版 开始 ，PostgreSQL 开始 支 
持 对 物化 视图 建立 索引 。 



































6.3.4 ”基于 部 分 记录 的 索引 

基于 部 分 记录 的 索引 (有 时 也 称 为 已 筛选 索引 ) 是 一 种 仅 针对 表 中 部 分 记录 的 索引 ， 而且. 
这 部 分 记录 需要 满足 WHERE 语句 设置 的 入 先 条件。 例如 ， 假 设 某 表 中 有 1 000 000 条 记录 ， 
但 你 只 会 查询 其 中 的 一 个 记录 数 为 10 000 的 子 集 ， 那 么 该 场景 就 非常 适合 使 用 基于 部 分 记 
录 的 索引 。 这 种 索引 比 全 量 索引 要 快 ， 因 为 其 体积 小 ， 所 以 可 以 把 更 多 索引 数据 缓存 到 内 
存 中 ， 另 外 该 类 索引 占用 的 磁盘 空间 也 会 更 小 。 


基于 部 分 记录 的 索引 能 够 实现 仅 针对 部 分 记录 的 唯一 性 约束 。 举 个 例子 ， 假 设 你 手 上 有 一 
家 报纸 在 过 去 10 年 间 的 订阅 用 户 数据 ， 现 在 需要 确保 还 在 订阅 的 用 户 们 不 会 每 天 多 拿 一 
份 报纸 。 由 于 人 们 对 纸 媒 的 兴趣 下 降 ， 因 此 这 10 年 间 的 全 量 订 阅 用 户 中 仅 有 5% 的 人 还 在 
坚持 订阅 。 所 以 ， 很 显然 你 不 需要 关注 那些 已 经 退 订 的 用 户 ， 因 为 他 们 的 姓名 早已 从 报纸 
递送 员 手 上 的 递送 名 单 中 剔除 。 表 结构 如 下 : 























CREATE TABLE subscribers ( 

id serial PRIMARY KEY, 

name varchar(50) NOT NULL, type varchar(50), 
is_active boolean); 





我 们 建立 一 个 基于 当前 活跃 用 户 的 部 分 记录 索引 即 可 : 
CREATE UNIQUE INDEX uq ON subscribers USING btree(Lower(name)) WHERE is_active; 
索引 的 WHERE 条 件 中 使 用 的 函数 必须 是 确定 性 函数 ， 即 固定 的 输入 一 定 能 


够 得 到 固定 输出 的 函数 。 这 意味 着 有 儿 类 函数 是 不 能 用 作 饰 选 条 件 的 : 一 
ee 一 类 是 依赖 于 其 他 表 数 
































进行 运算 的 函数 ， 其 输出 结果 受 其 他 表 的 数据 的 影响 ， 因 此 答 出 也 是 不 
有 和 进行 运算 的 函数 ， 其 输出 
也 不 会 受 控 。 


我 们 需要 特别 强调 的 一 点 是 ， 当 使 用 SELECT 语句 查询 数据 时 ， 创 建 索引 时 所 使 用 的 条 件 必 
须 是 你 的 WHERE 条 件 的 子 集 。 这 看 起 来 比较 麻烦 也 容易 出 错 ， 那 么 有 一 个 办 法 可 以 让 事情 
变 得 简单 一 些 ， 那 就 是 建 一 个 视图 ， 视 图 条 件 就 是 建 索 引 的 条 件 ， 那 么 针对 此 视图 进行 查 
询 就 永远 不 会 漏 掉 条 件 了 。 还 是 以 前 述 报 纸 订 阅 用 户 数据 为 例 ， 建 立 如 下 视图 
































CREATE OR _ REPLACE VIEW vw_subscribers_current AS 
SELECT id, lower(name) As name FROM subscribers WHERE is_active = true; 


然后 将 针对 原 表 的 查询 都 改 为 针对 此 视图 的 查询 (有 一 种 比较 激进 的 观点 认为 此 种 情况 下 
永远 都 不 应 该 直接 查询 原 表 ) : 


SELECT * FROM vw_active_subscribers WHERE User_name = 'sandy'; 





你 可 以 查看 规划 器 输出 的 执行 计划 来 检查 你 的 索引 是 否 被 用 上 了 。 


全 


6.3.5 ”多 列 索引 

多 列 索引 也 称 为 复合 索引 '。 在 本 章 前 面 的 内 容 中 ,你 应 该 已 经 见 到 了 大 量 复合 索引 的 例子 。 
另外 我 们 还 想 介绍 的 一 点 是 : 你 可 以 使 用 多 个 基础 列 创建 功能 索引 。 以 下 是 一 个 多 列 索 引 
的 示例 。 











CREATE INDEX idx ON subscribers USING btree (type, upper(name) varchar_pat 
tern_ops); 


PostgreSQL 的 规划 器 在 语句 执行 过 程 中 会 自动 使 用 一 种 被 称 为 “位 图 索引 扫描 ”的 策略 来 














注 1: 复合 索引 的 多 个 字段 中 也 可 以 包含 函数 ， 此 时 建立 的 索引 既是 复合 索引 也 是 函数 索引 。 
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同时 使 用 多 个 索引 。 该 策略 可 以 使 得 多 个 单列 索引 同时 发 挥 作用 ， 达 到 的 效果 与 使 用 单个 
复合 索引 相同 。 如 果 你 不 Wd nn s 件 的 场景 多 一 些 还 是 
同时 以 多 列 作 为 查询 条 件 的 场景 多 一 些 ， 那 么 最 好 针对 可 能 作为 查询 条 件 的 每 个 列 单独 建 
立 索 引 ， 这 样 是 最 灵活 的 做 法 ， 规 划 器 会 决定 如 何 组 合 使 用 这 些 索引 。 


假设 你 建 了 一 个 复合 B- 树 索 引 ， 其 中 包含 type、upper(name) 等 多 个 字段 ， 那 么 完全 没 必 
要 针对 type 字段 再 单独 建 一 个 索引 ， 因 为 规划 器 即使 在 遇 到 只 有 type 单字 段 的 查询 条 件 
时 也 会 自动 使 用 该 复合 索引 ， 这 是 规划 器 的 一 项 基本 能 


PostgreSQL 从 9.2 版 开始 支持 仅 依赖 索引 内 数据 的 查询 方法 ， 也 就 是 说 如 果 查 询 的 目标 字 
段 在 索引 内 都 有 ， 那 么 直接 扫描 索引 就 可 以 得 到 查询 结果 ， 根 本 不 需要 访问 表 的 本 体 了 。 
> E 的 引入 使 得 复合 索引 的 作用 更 为 凸显 ， 因 为 复合 索引 可 以 提供 更 多 数据 ， 因 此 更 
合 使 用 此 种 查询 方法 。 如 果 你 的 业务 场景 中 查询 的 目标 字段 和 条 件 字段 是 相同 的 那 几 
， 那 么 就 应 该 建立 复合 索引 以 提升 查询 速度 。 不 过 ， 索 引 中 包含 的 字段 越 多 也 就 意味 着 
ee s 间 会 越 大 ， 能 在 内 存 中 缓存 的 索引 条 目 就 越 少 ， 因 此 请 不 要 滥用 复合 索引 。 
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PostgreSQL 在 对 ANSI SQL 标准 的 遵从 度 方 面 已 经 远 远 走 在 了 其 他 数据 库 的 前 面 。 除 了 适 
配 标 准 之 外 ，PostgreSQL 还 提供 了 类 型 多 样 的 强化 语法 ， 这 些 强化 包括 易 用 的 简化 语法 以 
及 一 些 前 卫 到 足以 打破 关系 型 SQL 边界 的 语法 特性 。 通 过 这 些 努 力 ，PostgreSQL 保持 了 
持续 领先 。 本 章 中 ， 我 们 还 将 介绍 一 些 其 他 数据 库 中 很 少见 的 SQL 语法 特性 。 我 们 希望 你 
在 开始 学 习 本 章 之 前 已 经 具有 了 一 定 的 SQL 开发 经 验 ， 否 则 你 可 能 无 法 理解 PostgreSQL 
为 简化 SQL 开发 工作 所 做 的 努力 。 


7.1 视图 

关系 型 数据 库 中 的 表 存 储 的 是 规范 化 的 数据 ， 因 此 当 需 要 从 多 张 表 中 取 数 据 时 ， 就 需要 写 
关联 查询 的 SQL 语句 。 如 果 你 的 应 用 场景 需要 反复 执行 这 种 关联 查询 语句 ， 可 以 考虑 创建 
一 个 视图 。 简 单 来 说 ， 视 图 就 是 持久 化 存储 在 数据 库 中 的 一 个 查询 语句 。 


有 人 认为 用 户 不 应 该 直接 访问 表 ， 而 应 该 通过 视图 来 访问 ， 不 过 这 就 意味 着 需要 为 每 张 表 
都 创建 一 个 视图 。 这 种 做 法 的 优点 是 在 表 的 本 体 之 上 增加 了 一 个 访问 层 ， 方便 了 权限 控制 
和 业务 逻辑 抽象 ， 缺 点 就 是 太 有 麻烦。 我 们 认为 这 个 观点 是 合理 的 ， 但 事实 上 由 于 惰性 很 少 
有 人 会 这 么 做 。 

PostgreSQL 的 视图 功能 近年 来 有 了 长 足 的 发 展 。 在 9.1 版 之 前 ， 要 想 对 视图 进行 更 新 
操作 ， 唯 一 的 方法 就 是 使 用 规则 。“ 使 用 可 更 新 视图 来 对 数据 库 进 行 抽象 ”(http://www. 
postgresonline.com/journal/archives/1 1-Database-Abstraction-with-updatable-Views.html) 这 篇 


博文 中 有 一 个 关于 规则 的 例子 。 在 9.1 版 及 之 后 的 版 本 中 ， 你 依然 可 以 通过 创建 规则 来 更 
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新 视图 ， 但 我 们 推荐 使 用 INSTEAD OF 触发 器 来 实现 该 功能 ， 这 是 业界 标准 做 法 ， 其 他 数据 
库 一 般 也 都 这 么 实现 。 











9.3 版 中 推出 了 可 自动 更 新 的 视图 。 如 果 你 的 视图 是 从 单个 表 得 出 的 ， 并 且 你 将 主键 作为 
一 个 输出 列 ， 那 么 就 可 以 直接 对 此 视图 发 出 UPDATE 命令 。 基 础 表 将 存储 该 更 新 。 





























9.3 版 中 还 引入 了 物化 视图 。 每 个 视图 都 对 应 一 个 SQL 查询 语句 ， 视 图 本 质 上 就 是 该 SQL 
的 查询 结果 集 的 一 个 别名 。 每 次 访问 视图 时 都 需要 执行 其 对 应 的 SQL， 但 物化 视图 将 视图 
逻辑 映射 后 的 数据 记录 实际 存储 下 来 ， 这 样 访 问 物 化 视图 时 就 省 略 了 视图 底层 SQL 的 执行 
过 程 ， 就 像 访问 一 张 本 地 表 一 样 。 一 旦 物化 视图 建立 好 以 后 ， 只 有 对 它 执 行 REFRESH 操作 
时 才 会 再 次 从 基础 表 中 读 取 数据 。 根 据 前 面 的 描述 可 以 知道 ， 使 用 物化 视图 可 以 节省 计算 
资源 ， 因 为 视图 底层 SQL (这 种 SQL 逻辑 可 能 极其 复杂 ) 不 用 反复 执行 。 但 物化 视图 也 
有 缺点 ， 因 为 如 果 刷 新 不 及 时 就 会 导致 取出 的 数据 可 能 不 是 最 新 的 。 




























































































9.4 版 开始 支持 用 户 在 物化 视图 刷新 时 也 能 对 其 进行 访问 ， 该 版 本 还 引入 了 WITH CHECK 
OPTION 修饰 符 ， 用 于 防止 在 视图 的 范围 之 外 进行 插入 和 更 新 。 





























7.1.1 单 表 视图 
最 简单 的 视图 是 从 单个 表 得 出 的 。 如 果 打 算 将 数据 写 回 到 该 表 ， 请 始终 包含 主键 ， 如 示例 
7-1 所 示 。 








示例 7-1: 创建 基于 单 表 的 视图 
CREATE OR _ REPLACE VIEW census.Vvw_facts_2011 AS 
SELECT fact type id, val, yr, tract_ id FROM census.facts WHERE yr = 2011; 





自从 9.3 版 起 ， 就 可 以 使 用 INSERT、UPDATE 和 DELETE 命令 在 该 视图 中 更 改 数据 了 。 更 新 
和 删除 命令 将 遵从 作为 视图 一 部 分 的 任何 HERE 条 件 。 例 如 ， 下 面 的 删除 命令 将 仅 删 除 
yr=2011 的 记录 : 
































DELETE FROM census.vw_facts 2011 WHERE val = 0; 
以 下 UPDATE 操作 更 新 不 了 任何 记录 : 
UPDATE census.vw_facts 2011 SET vaL = 1 WHERE val = 0 AND yr = 2012; 


注意 你 可 以 插入 和 更 新 将 该 视图 置 于 视图 的 WHERE 条 件 之 外 的 数据 : 








UPDATE census.vw_facts_2011 SET yr = 2012 WHERE yr = 2011; 














上 述 UPDATE 语句 操作 的 目标 记录 是 落 在 视图 可 见 范 围 内 的 ， 但 更 新 后 会 把 本 来 落 在 视图 可 
见 范围 内 的 记录 变 成 了 落 到 视图 可 见 范围 之 外 ， 也 就 是 说 视图 更 新 后 少 了 一 条 记录 。 但 为 
了 保持 视图 数据 的 一 致 性 ， 我 们 不 希望 这 种 情况 发 生 ， 也 就 是 说 希望 更 新 后 的 数据 仍然 应 
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该 落 在 视图 可 见 范 围 内 。 这 可 以 通过 9.4 版 中 引入 的 NITH CHECK OPTION 修饰 符 来 实现 。 创 
建 视图 时 如 果 包 含 此 修饰 符 ， 那 么 此 视图 中 插入 的 数据 或 者 更 新 后 的 数据 落 在 视图 可 见 范 
围 之 外 时 ， 系 统 会 报错 ， 违 反 了 该 约束 的 操作 会 失败 。 下 面 我 们 将 限定 vs_facts_2011 视 
图 仅 人 允许 插入 2011 年 的 数据 ， 同 时 不 允许 将 yr 字段 修改 为 2011 以 外 的 其 他 值 。 我 们 修 
改 一 下 视图 定义 把 这 个 约束 加 上 ， 语 法 如 示例 7-2 所 示 。 

































































示例 7-2: 创建 带 有 WITH CHECK OPTION 约束 的 单 表 视图 
CREATE OR _ REPLACE VIEW census.vw_facts_2011 AS 
SELECT fact_ type_id, val, yr, tract id 
FROM census.facts WHERE yr = 2011 WITH CHECK OPTION; 











尝试 执行 以 下 更 新 操作 : 
UPDATE census.vw_facts 2011 SET yr = 2012 WHERE val > 2942; 
你 会 看 到 这 样 的 报错 信息 : 


ERROR: new row violates WITH CHECK OPTION for view"vw_facts_2011" 
DETAIL: Failing row contains (1, 25001010500, 2012, 2985.000,100.00). 


7.1.2 ”使 用 触发 器 来 更 新 视图 

视图 可 以 将 针对 多 张 表 的 关联 查询 封装 为 针对 视图 的 简单 查询 。 如 果 视 图 的 基 表 有 多 张 ， 
那么 直接 更 新 该 视图 是 不 允许 的 ， 因 为 多 张 表 必然 带 来 的 问题 就 是 操作 要 沙 到 哪个 基 表 
上 ，PostgreSQL 是 无 法 自动 判定 的 。 假 设 你 有 一 个 视图 ， 该 视图 基于 一 张 国 家 信息 表 和 
一 张 省 份 信息 表 ， 此 时 你 希望 删除 该 视图 的 一 条 记录 ，PostgreSQL 无 法 得 知 你 到 底 想 要 
仅 删除 一 条 国家 记录 ， 还 是 仅 删 除 一 个 省 份 记录 ， 还 是 删除 一 个 国家 以 及 该 国家 对 应 的 
所 有 省 的 记录 。PostgreSQL 无 法 自动 判定 你 想 做 什么 并 不 代表 就 不 能 对 这 种 复杂 视图 进 
行 修改 操作 ， 你 可 以 通过 编写 触发 器 来 对 这 些 操作 进行 转 勾 处 理 ， 转 义 后 的 逻辑 中 可 以 
体现 你 的 意图 。 































































































我 们 首先 建立 一 个 关联 了 两 张 表 的 视图 ， 如 示例 7-3 所 示 。 














示例 7-3: 创建 vw_facts 视图 
CREATE OR REPLACE VIEW census.vw_facts AS 
SELECT y.fact_type_id, y.category, y.fact_subcats, y.short_name, x.tract_id, x.yr, 
x.val, x.perc 
FROM census.facts As x INNER JOIN census.lu fact types As y 
ON x.fact_ type_id = y.fact type_id; 





然后 可 以 定义 一 个 或 者 多 个 INSTEAD OF 触发 器 来 实现 针对 INSERT、UPDATE、DELETE 这 三 大 
基本 操作 的 转 义 处 理 。 触 发 器 需要 有 一 个 基础 函数 ， 你 可 以 使 用 任何 语言 来 编写 该 基础 函 
数 ， 其 命名 也 没有 规则 限制 。 我 们 在 示例 7-4 中 选择 使 用 PL/pgSQL 语法 来 编写 。 
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示例 7-4: 在 vw_facts 视图 上 建 一 个 对 insert、update、delete 操作 进行 转 义 处 理 的 函数 
CREATE OR REPLACE FUNCTION census.trig vw_facts_ins_upd_del() RETURNS trigger AS 
$$ 
BEGIN 
IF (TG_ OP = 'DELETE') THEN @ 
DELETE FROM census .facts AS 千 
WHERE 
f.tract_id = OLD.tract id AND f.yr = OLD.yr AND 
f.fact_ type_id = OLD.fact type_id; 
RETURN OLD; 
END IF; 
IF (TG_OP = 'INSERT') THEN @ 
INSERT INTO census.facts(tract id, yr, fact type_id, val, perc) 
SELECT NEW.tract_id, NEW.yr, NEW.fact_type_id, NEW.val, NEW.perc; 
RETURN NEW; 
END IF; 
IF (TG_OP = 'UPDATE') THEN © 
IF 





ROW(OLD.fact_type_id, OLD.tract_id, OLD.yr, OLD.val, OLD.perc) != 
ROW(NEW. fact_type_id, NEW.tract_id, NEW.yr, NEW.val, NEW.perc) 
THEN @ 
UPDATE census.facts AS f 
SET 
tract id = NEW.tract_id, 
yr = NEW.yr, 
fact_type_id = NEW.fact_type_id, 
val = NEW.val, 
perc = NEN.perc 
WHERE 
f.tract id = OLD.tract_id AND 
f.yr = 0LD.yr AND 
f.fact_type_id = OLD.fact type_id; 
RETURN NEW; 
ELSE 
RETURN NULL 
END IF; 
END IF; 
END; 
$$ 
LANGUAGE plpgsql VOLATILE; 


























@ 对 删除 操作 进行 转 义 处 理 ， 筛 选 条 件 的 字段 取 值 来 源 于 0LD 记录 。 
@ 对 插入 操作 进行 转 义 处 理 。 
日 对 更 新 操作 进行 转 义 处 理 。 根 据 0LD 记录 的 内 容 判断 哪些 记录 要 更 新 为 NEW 记录 。? 
@ 比较 0LD 记录 和 NEW 记录 的 字段 值 ， 只 有 二 者 不 一 样 时 才 真正 执行 更 新 动作 。 
























































注 1: 0LD 记录 是 指 原始 的 针对 视图 的 删除 动作 所 要 删除 的 视图 记录 。 也 就 是 说 ，0LD 记录 是 视图 记录 ， 而 
非 视图 基础 表 的 记录 。 一 一 译 者 注 
注 2: NEW 记录 指 的 是 原始 的 针对 视图 的 更 新 动作 设置 的 修改 后 的 视图 记录 。 也 就 是 说 ,NEW 记录 是 视图 记录 ， 
而 非 视 图 基础 表 的 记录 。 一 一 译 者 注 
















































































| 全 A 


第 7 章 


接 下 来 ， 我 们 将 此 触发 器 函数 绑 定 到 视图 上 ， 语 法 如 示例 7-5 所 示 。 





示例 7-5: 将 触发 右 国 数 绑 定 到 视图 上 
CREATE TRIGGER census.trig 01_vw_facts_ins_upd_del 
INSTEAD OF INSERT OR UPDATE OR DELETE ON census.vw_facts 
FOR EACH ROW EXECUTE PROCEDURE census.trig vw_ facts_ins_upd_del(); 


现在 针对 视图 进行 更 新 、 删 除 或 插入 操作 时 ， 这 些 操作 将 更 新 基础 facts 表 : 





UPDATE census.vw_facts SET yr = 2012 WHERE yr = 2011 AND tract_id = 
'25027761200'; 


执行 后 会 输出 一 条 注释 : 





Query returned successfuLLy: 56 rows affected, 40 ms execution time. 





如 果 我 们 试图 更 新 的 字段 不 在 更 新 行 比较 列表 中 (如 此 处 所 示 )， 那 么 更 新 操作 就 不 会 命 
中 任何 记录 ， 因 为 入 口 条 件 不 满足 : 











UPDATE census.vw_facts SET short name = 'test'; 
输出 消息 将 如 下 所 示 : 


Query returned successfuLLy: 0 rows affected, 931 ms execution time. 





前 面 的 例子 中 我 们 用 一 个 触发 器 函数 处 理 了 所 有 类 型 的 触发 事件 (insert、update、 
delete)， 但 实际 上 专门 为 每 种 触发 事件 创建 一 个 独立 的 触发 器 也 是 可 以 的 。 











7.1.3 物化 视图 

物化 视图 会 把 视图 可 见 范围 内 的 数据 在 本 地 缓存 下 来 ， 然 后 就 可 以 当成 一 张 本 地 表 来 使 
用 。 首 次 创建 物化 视图 以 及 对 其 执行 REFRESH MATERIALIZED VIEW 刷新 操作 时 都 会 触发 数据 
缓存 动作 ， 只 不 过 前 者 是 全 量 缓存 ， 后 者 是 增 量 刷新 。 请 注意 物化 视图 特性 是 从 9.3 版 开 
始 支持 的 。 


物化 视图 最 典型 的 应 用 场景 是 用 于 加 速 时 效 性 要 求 不 高 的 长 时 复杂 查询 ， 在 OLAP (在 线 
分 析 与 处 理 ) 领域 ， 这 种 查询 是 经 常 出 现 的 。 


















































物化 视图 还 有 一 个 特点 就 是 支持 建立 索引 以 加 快 查询 速度 。 示 例 7-6 建立 了 示例 7-1 中 的 
视图 的 物化 版 本 。 








示例 7-6: 建立 物化 视图 
CREATE MATERIALIZED VIEW census.vw_facts_2011_materialized AS 
SELECT fact_type_id, val, yr, tract_id FROM census.facts WHERE yr = 2011; 




















然后 对 物化 视图 建立 一 个 索引 ， 语 法 与 在 普通 表 上 建 索引 完全 相同 ， 如 示例 7-7 所 示 。 
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示例 7-7: 在 物化 视图 上 建立 索引 
CREATE UNIQUE INDEX ix 
ON census.vw_facts_2011_materiaLized (tract id, fact_type_id, yr); 


当 物 化 视图 中 含 大 量 记录 时 ， 为 了 加 快 对 它 的 访问 速度 ， 我 们 需要 对 数据 进行 排序 。 要 实 
现 这 一 点 ， 最 简单 的 方法 就 是 在 创建 物化 视图 时 使 用 的 SELECT 语句 中 增加 ORDER BY 子 句 。 
另外 一 种 方法 就 是 对 其 执行 聚 簇 排 序 操作 以 使 得 记录 的 物理 存储 顺序 与 索引 的 顺序 相同 ， 
具体 步骤 是 ， 首先 创建 一 个 索引 ， 该 索引 应 体现 你 所 希望 的 排序 ， 然 后 基于 指定 索引 对 物 
化 视图 执行 CLUSTER 命令 ， 语 法 如 示例 7-8 所 示 。 


示例 7-8: 基于 某 索 引 对 物化 视图 执行 聚 徐 排 序 操 作 
CLUSTER census.vw_facts_2011_materialized USING ix; © 
CLUSTER census.vw_ facts 2011 materialized; @ 























@ 指定 聚 禾 操 作 所 依据 的 索引 名 。 执 行 过 以 后 系统 就 会 自动 记 下 该 表 是 依据 哪个 索引 进 
行 聚 复 排 序 的 ， 后 面 再 次 执行 聚 徐 操 作 时 系统 会 自动 使 用 该 索引 ， 所 以 索引 名 仅 在 首 
次 聚 禾 操 作 时 需要 ， 后 续 不 再 需要 。 

@ 每 次 刷新 过 物化 视图 后 ， 都 需要 重新 对 其 进行 一 次 聚 禾 排 序 操作 。 


相对 于 CLUSTER 方案 来 说 ，ORDER BY 方案 的 优点 在 于 每 次 执行 REFRESH MATERIALIZED VIEW 
时 都 会 自动 对 记录 进行 重 排序 ， 但 CLSUTER 方案 就 必须 手动 执行 ， 甚 缺点 在 于 物化 视图 加 
了 ORDRE BY 以 后 ，REFRESH 操作 执行 会 耗 时 更 入 。 在 正式 使 用 ORDER BY 方案 之 前 ， 你 应 该 
对 REFRESH 操作 进行 测试 ， 看 其 性 能 是 否 可 接受 。 另 一 种 测试 方法 是 直接 运行 创建 物化 视 
图 时 所 用 的 带 ORDER BY 的 SQL 语句 。 


在 PostgreSQL 9.3 版 中 ， 刷 新 物化 视图 的 语法 如 下 : 
































REFRESH MATERIALIZED VIEW census.vw_facts_2011_materiaLitzed; 


在 PostgreSQL 9.4 版 中 ， 为 了 解决 物化 视图 刷新 操作 导致 的 锁 表 问题 ， 可 以 使 用 以 下 语法 : 





REFRESH MATERIALIZED VIEWN CONCURRENTLY census.vw_facts_2011_materiaLitzed; 
物化 视图 有 以 下 几 个 缺点 。 


。 不 支持 通过 CREATE OR REPLACE 语法 来 对 一 个 现 有 的 物化 视图 进行 重建 ， 要 想 重建 只 
能 先 删除 再 重建 ， 即 使 只 做 很 小 的 改变 也 需要 这 么 干 。 删 除 语法 是 DROP MATERIALIZED 
VIEW+ 视图 名 。 删 除 以 后 ， 该 视图 上 所 有 的 索引 都 会 丢失 。 

。 每 次 刷新 数据 时 都 要 执行 一 次 REFRESH MATERIALIZED VIEW 操作 。PostgreSQL 不 支持 自 
动 刷 新 物化 视图 。 要 想 实现 自动 刷新 ， 你 必须 使 用 类 似 crontab、pgAgent 定时 任务 或 
者 是 触发 器 之 类 的 机 制 。 我 们 在 “使 用 物化 视图 和 语句 级 触发 喜来 实现 数据 缓存 ”这 篇 
博 文 (http://www.postgresonline.com/journal/archives/313-Caching-data-with-materialized- 
views-and-statement-level-triggers.html) 中 提供 了 一 个 使 用 触发 器 来 进行 刷新 的 例子 ， 可 
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供 你 参考 。 

。 在 9.3 版 中 ， 刷 新 物化 视图 是 一 个 阻塞 操作 ;也 就 是 说 ， 视 图 在 刷新 期 间 是 无 法 访问 的 。 
9.4 版 中 引入 了 一 个 新 的 CONCURRENTLY 关键 字 ， 在 REFRESH 命令 中 增加 了 该 关键 字 以 后 ， 
可 以 解除 锁定 限制 ， 前 提 条 件 是 被 刷新 的 物化 视图 上 要 有 一 个 唯一 索引 。 实 现 无 锁 刷 新 
的 代价 就 是 如 果 有 人 在 刷新 期 间 进行 视图 访问 ， 那 么 刷新 时 间 会 变 长 。 


7.2 ”灵活 易 用 的 PostgreSQL 专 有 SQL 语法 


我 们 在 多 年 编写 SQL 语句 的 过 程 中 使 用 过 很 多 PostgreSQL 的 专 有 语法 ， 借 助 它们 可 以 编 
写 出 更 加 简洁 以 及 功能 更 加 强大 的 SQL。 我 们 在 本 节 中 介绍 的 这 些 语法 都 是 PostgreSQL 
的 专 有 语法 。“ 专 有 ”意味 着 该 语法 不 符合 ANSI SQL 标准 。 如 果 你 的 老板 要 求 编写 的 
SQL 必须 遵守 ANSI SQL 标准 ， 又 或 者 你 的 SQL 需要 移植 到 别 的 数据 库 上 去 ， 那 么 请 不 
要 使 用 本 节 介 绍 的 这 些 专 有 语法 。 













































































7.2.1 DISTINCT ON 


我 们 认为 最 好 用 的 一 个 专 有 语法 就 是 DISTINCT ON， 其 功能 类 似 DISTINCT 但 却 可 以 精确 到 
更 细 的 粒度 。DISTINCT 会 将 结果 集中 完全 重复 的 记录 剔除 ， 但 DISTINCT ON 可 以 将 结果 集 
中 指定 字段 值 的 重复 记录 剔除 ， 具 体 实现 方法 是 先 对 结果 集 按照 DISTINCT ON 指定 的 字段 
进行 排序 ， 然 后 和 蔓 选 出 每 个 字段 值 第 一 次 出 现时 所 在 的 记录 ， 其 余 的 记录 都 剔除 。 可 以 看 
到 一 个 小 小 的 单词 ON 就 实现 了 必须 写 大 量 代码 才能 实现 的 功能 。 


在 示例 7-9 中 ， 我 们 演示 了 如 何 获 取 马萨诸塞 州 每 个 县 的 第 一 个 人 口 统计 区 的 信息 。 


















































示例 7-9: DISTINCT ON 的 用 法 
SELECT DISTINCT ON (left(tract id, 5)) 
left(tract_id, 5) As county, tract_id, tract_name 
FROM census.lu_tracts 
ORDER BY county, tract id; 


county tract_name 


| | 
+ + 
25001 | 25001010100 | Census Tract 101, Barnstable County, Massachusetts 
| | 
| | 
| | 
| | 


25003900100 | Census Tract 9001, Berkshire County, Massachusetts 


25005 25005600100 | Census Tract 6001, Bristol County, Massachusetts 
25007 25007200100 | Census Tract 2001, Dukes County, Massachusetts 
25009 25009201100 Census Tract 2011, Essex County, Massachusetts 


请 注意 ，ON 修饰 符 支 持 设 置 多 列 ， 运 算 时 将 基于 这 多 个 列 的 总 体 唯 一 性 来 进行 去 重 操 
作 。 同 时 查询 语句 中 ORDER BY 子 句 的 排序 字段 列表 的 最 左 侧 必须 是 DISTINCT ON 指定 的 
字段 列表 ， 即 保证 整个 结果 集 是 按照 这 几 个 字段 排序 的 ， 这 样 最 终 去 重 后 得 到 的 结果 才 
是 你 想 要 的 。 
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7.2.2 ” LIMIT 和 OFFSET 关 键 字 

LIMIT 关键 字 指 定 了 查询 时 仅 返回 指定 数量 的 记录 ，0OFFSET 关键 字 指 定 了 从 第 几 条 记录 
开始 返回 。 你 可 以 将 二 者 结合 起 来 使 用 也 可 以 单独 使 用 。 一 般 来 说 ， 这 两 个 关键 字 总 是 
和 ORDER BY 联 用 的 ， 因 为 只 有 在 一 个 已 经 按照 用 户 的 意图 排 好 序 的 结果 集 上 指定 返回 特 
定 的 子 结果 集 才 有 意义 。 在 示例 7-10 中 ， 我 们 演示 了 OFFSET 关键 字 的 用 法 ， 如 果 不 设置 
OFFSET 的 话 ， 其 值 默 认为 0。 


该 语法 并 非 PostgreSQL 所 特有 ， 事 实 上 它 最 早 源 自 于 MySQL。 这 种 限制 返回 结果 记录 数 
的 功能 在 很 多 数据 库 中 都 支持 ， 但 具体 语法 和 内 部 实现 机 制 各 有 千秋 。 


示例 7-10: 要 求 示例 7-9 的 查询 结果 集 仅 返 回 从 第 3 条 开始 的 3 条 记录 
SELECT DISTINCT ON (left(tract id, 5)) 
Left(tract id, 5) As county, tract id, tract_name 
FROM census.lu_ tracts 
ORDER BY county, tract id LIMIT 3 OFFSET 2; 










































































county | tract id | tract_name 

人 机 
25005 | 25005600100 | Census Tract 6001, Bristol County, Massachusetts 
25007 | 25007200100 | Census Tract 2001, Dukes County, Massachusetts 
25009 | 25009201100 | Census Tract 2011, Essex County, Massachusetts 


7.2.3 简化 的 类 型 转换 语法 

ANSI SQL 标准 中 定义 了 一 个 名 为 CAST 的 类 型 转换 函数 ， 可 以 实现 数据 类 型 之 间 的 互 
转 。 例 如 CAST('2011-1-11' AS date) 可 以 将 文本 2011-1-1 转换 为 一 个 日 期 型 数据 。 
PostgreSQL 支持 一 种 简写 语法 ， 该 语法 使 用 了 两 个 冒号 来 表示 转换 关系 ， 有 具体 格式 为 : 
'2011-1-1'::date。 这 种 写法 形式 更 简洁 也 更 易于 使 用 ， 比 如 有 时候 我 们 需要 级 联 执行 
个 类 型 转换 动作 ， 也 就 是 说 需要 将 类 型 A 转换 为 类 型 B 再 转 为 类 型 C， 这 种 情况 用 简写 语 
法 也 是 可 以 实现 的 ， 例 如 someXML: :text::integer。 


7.2.4 一 次 性 插入 多 条 记录 
PostgreSQL 支持 一 次 性 插入 多 条 记录 的 语法 。 示 例 7-11 演示 了 如 何 向 我 们 在 示例 6-2 中 创 
建 的 表 中 一 次 性 插入 多 条 记录 。 


示例 7-11: 一 次 性 插入 多 条 记录 
INSERT INTO Logs_2011 (user_name, description, log_ts) 
VALUES 
('robe', 'logged in', '2011-01-10 10:15 AM EST'), 
('lhsu', 'logged out', '2011-01-11 10:20 AM EST'); 























请 注意 ， 在 PostgreSQL 中 VALUES 子 句 并 不 是 只 能 作为 INSERT 语句 的 一 部 分 来 使 用 ， 它 其 
实 是 一 个 动态 生成 的 临时 结果 集 ， 可 用 于 多 种 场合 ， 如 示例 7-12 所 示 。 








A 
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示例 7-12: 使 用 VALUES 语法 来 模拟 一 个 虚拟 表 
SELECT * 
FROM ( 
VALUES 
('robe', 'logged in', '2011-01-10 10:15 AM EST' : :timestamptz ) ， 
('lhsu', 'logged out', '2011-01-11 10:20 AM EST'::timestamptz) 
) AS L (user_name, description, log_ts); 


将 VALUES 子 名 当 作 一 个 虚拟 表 来 用 时 ， 需 要 为 该 表 指 定 字段 名 ， 并 将 那些 无 法 隐 式 转换 的 
字段 值 显 式 地 进行 类 型 转换 。 


7.2.5 ”使 用 ILIKE 实 现 不 区 分 大 小 写 的 查询 

PostgreSQL 是 一 套 区 分 大 小 写 的 系统 ， 如 果 要 实现 不 区 分 大 小 写 的 文本 搜索 ， 有 两 种 方 
法 : 一 种 是 将 ANSI LIKE 运算 符 两 边 的 文本 都 用 upper 函数 转 为 大 写 ， 但 这 样 会 导致 用 不 
上 索引 ,或 者 必须 单独 建立 一 个 基于 upper 函数 的 函数 式 索 引 才 能 使 查询 语句 用 上 索引 ， 
另 一 种 是 使 用 PostgreSQL 所 特有 的 ILIKE 运算 符 (~)， 语 法 如 下 : 























SELECT tract name FROM census.Lu_tracts WHERE tract name ILIKE '%duke%'; 


tract_name 


Census Tract 2001, Dukes County, Massachusetts 
Census Tract 2002, Dukes County, Massachusetts 
Census Tract 2003, Dukes County, Massachusetts 
Census Tract 2004, Dukes County, Massachusetts 
Census Tract 9900, Dukes County, Massachusetts 


7.2.6 可 以 返回 结果 集 的 函数 
PostgreSQL 允许 返回 集 的 函数 显示 在 SQL 语句 的 SELECT 子 句 中 。 许 多 其 他 数据 库 都 不 支 
持 该 特性 ， 在 这 些 数据 库 中 仅 会 在 SELECT 子 句 中 显示 标量 函数 。 


在 一 个 复杂 的 SQL 语句 中 使 用 返回 结果 集 的 函数 很 容易 就 会 导致 意外 的 结果 ， 这 是 因为 
这 类 函数 输出 的 结果 集会 与 该 语句 其 他 部 分 生成 的 结果 集 产生 笛 卡 儿 积 ， 从 而 生成 更 多 的 
记录 行 。 因 此 在 使 用 之 前 你 必须 对 此 后 果 有 所 了 解 。 在 示例 7-13 中 ， 我 们 使 用 generate_ 
series 国 数 演示 了 这 种 情况 。 先 建 表 如 下 : 




































































CREATE TABLE ;intervaL_periods (i type interval); 
INSERT INTO interval_periods (i type) 
VALUES('5 months'), ('132 days'), ('4862 hours'); 


示例 7-13: 在 SELECT 语句 中 使 用 返回 结果 集 的 函数 
SELECT i_type, 
generate_series('2012-01-01'::date,'2012-12-31'::date,i type) As dt 
FROM interval_periods; 
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| 
本 
5 months | 2012-01-01 00:00:00-05 
5 months | 2012-06-01 00:00:00-04 
| 
| 
| 
| 


5 months 2012-11-01 00:00:00-04 
132 days 2012-01-01 00:00:00-05 
132 days 2012-05-12 00:00:00-04 
132 days 2012-09-21 00:00:00-04 


4862 hours | 2012-01-01 00:00:00-05 
4862 hours | 2012-07-21 15:00:00-04 


7.2.7 ”限制 对 继承 表 的 DELETE、UPDATE、INSERT 操 作 的 影响 
范围 

如 果 表 间 是 继承 关系 ， 那 么 查询 父 表 时 就 会 将 子 表 中 满足 条 件 的 记录 也 查 出 来 。DELETE 和 
UPDATE 操作 也 遵循 类 似 逻 辑 ， 即 对 父 表 的 修改 操作 也 会 影响 子 表 的 记录 。 有 了 时 你 可 能 希望 
操作 仅 限定 于 主 表 范围 之 内 而 并 不 希望 子 表 受 到 波及 。 

PostgreSQL 提供 了 ONLY 关键 字 以 实现 此 功能 。 我 们 在 示例 7-30 中 展示 了 ONLY 的 用 法 。 在 
该 示例 中 ， 我 们 希望 仅 从 生产 表 中 删除 那些 尚未 迁移 到 日 志 表 中 的 记录 。 如 果 没 有 ONLY 修 
饰 符 ， 我 们 最 终 将 从 子 表 中 删除 先前 可 能 已 移动 过 的 记录 。 



































7.2.8 DELETE USING 语法 


我 们 经 常会 遇 到 “只 有 当 记 录 的 字段 值 落 在 另外 一 个 结果 集中 时 才 需 要 删除 该 记录 ”的 情 
况 ， 那 么 此 时 就 必须 借助 一 次 关联 查询 才能 定位 到 要 删除 的 目标 记录 。USING 子 句 可 以 将 
需要 借助 的 一 个 或 者 多 个 中 间 表 (或 者 子 查 询 ) 纳入 同一 个 DELETE 语句 中 。 在 示例 7-14 
中 ， 我 们 借助 一 个 关联 查询 实现 了 删除 census.facts 表 中 符合 short_name='s61' 这 个 条 件 
的 记录 。 
































示例 7-14: DELETE USING 的 用 法 


DELETE FROM census.facts 
USING census.Lu_fact_types As ft 
WHERE facts.fact type_id = ft.fact type_id AND ft.short_name = 's01'; 


而 符合 标准 的 方式 将 会 是 ， 在 WHERE 子 句 中 使 用 笨拙 的 IN 表达 式 。 


7.2.9 ”将 修改 影响 到 的 记录 行 返回 给 用 户 

RETURNING 是 ANSI SQL 规定 的 标准 语法 ， 但 支持 该 语法 的 数据 库 却 不 多 。 在 示例 7-30 中 ， 
我 们 通过 RETURNING 子 句 将 在 DELETE 操作 中 被 删除 的 记录 返回 给 了 用 户 。 当 然 ，INSERT 和 
UPDATE 操作 也 是 可 以 使 用 RETURNING 的 。 对 于 带 serial 类 型 字段 的 表 来 说 ，RETURNING 语 
法 是 很 有 用 的 ， 因 为 向 这 类 表 中 插入 记录 时 ，serial 字段 是 临时 生成 而 非 用 户 指定 的 。 也 
就 是 说 在 插入 动作 完成 之 前 ， 用 户 也 不 知道 serial 字段 的 值 会 是 多 少 ， 除 非 是 再 查询 一 
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遍 。 而 RETURNING 语法 使 得 用 户 不 用 再 次 查询 就 立即 得 到 了 serial 字段 的 值 。 最 常见 的 
用 法 一 般 是 RETURNING *， 即 返回 所 有 字段 的 值 ， 但 也 可 以 指定 仅 返回 特定 字段 ， 如 示例 
7-15 所 示 。 








示例 7-15: 在 UPDATE 语句 中 使 用 RETURNING 子 名 返回 修改 过 的 记录 
UPDATE census.Lu_fact_types AS 车 
SET short_name = repLace(repLace(Lower(f.fact_subcats[4])，， ','_'),':','"') 
WHERE f.fact_subcats[3] = 'Hispanic or Latino:' AND f.fact_subcats[4] > "' 
RETURNING fact_type_id, short_name; 


fact_type_id short_name 


| 
再 
| white_alone 
97 | black_or_african_american_alone 
| 
| 
| 
| 
| 


98 american_indian_and_alaska_native_alone 

99 asian_alone 

100 native_hawaiian_and_other_pacific islander_alone 
101 some_other_race_alone 

102 two_or_more_races 


7.2.10 在 查询 中 使 用 复合 数据 类 型 

PostgreSQL 会 在 建 表 时 自动 创建 一 个 结构 与 表 完 全 相同 的 数据 类 型 ， 其 中 包含 了 多 个 其 他 
数据 类 型 的 成 员 字 段 ， 因 此 也 会 被 称 为 复合 数据 类 型 。 你 第 一 次 见 到 基于 复合 数据 类 型 的 
查询 语句 时 可 能 会 感到 很 惊讶 。 事 实 上， 你 可 能 已 经 在 编写 调试 SQL 语句 的 过 程 中 见识 过 
它 的 神奇 之 处 。 先 看 一 下 这 个 语句 : 


























SELECT x FROM census.Lu_fact_types As x LIMIT 2; 


第 一 眼看 到 这 个 语句 时 ， 你 可 能 认为 我 们 漏 写 了 一 个 “.*”， 但 请 看 一 下 该 语句 的 执行 


EE 所 
结果 : 




















(86,Population,"{D001,Total:}",d001) 
(87,Population,"{D002,Total:,""Not Hispanic or Latino:""}",d002) 


语句 不 但 没有 报错 ， 而 且 返 回 的 结果 是 标准 的 Lu_fact_type 类 型 。 我 们 来 看 一 下 第 一 行 记 
录 的 内 容 来 确认 有 没有 问题 ，86 是 fact_type_id 字段 的 值 ，Population 是 category 字段 
的 值 ，{D9001,Total:} 是 fact_subcats 属性 。 可 以 看 到 ， 字 上 段 值 与 表 定义 完全 匹配 ， 没 有 
问题 。 复 合 数 据 类 型 可 以 作为 多 个 很 有 用 的 函数 的 输入 ， 比 如 array_agg 和 hstore (hstore 
扩展 包 提 供 的 一 个 函数 ， 可 以 将 一 行 记录 转换 为 hstore 的 一 个 键 值 对 象 ) 等 。 

















如 果 你 的 项 目 正在 使 用 Ajax 技术 和 PostgreSQL 数据 库 ， 并 且 使 用 的 是 PostgreSQL 9.2 版 
或 者 更 新 的 版 本 ， 那 么 就 可 以 充分 利用 PostgreSQL 对 JSON 类 型 的 原生 支持 能 力 ， 通 过 联 
用 array_agg 和 array_to_json 这 两 个 函数 来 将 语句 的 查询 结果 转换 为 一 个 JSON 对 象 后 输 
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出 ， 如 示例 7-16 所 示 。 
示例 7-16: 将 查询 结果 转换 为 JSON 格式 


SELECT array_to_json(array_agg(f)) As cat © 

FROM ( 
SELECT MAX(fact_ type_id) As max_type, category @ 
FROM census.lu_fact types 
GROUP BY category 


) As f; 
输出 结果 如 下 : 
cats 


[{"max_type":102,"category":"Population"}, 
{"max_type":153,"category":"Housing"}] 


@ 将 子 查 询 f 中 的 所 有 记录 转换 为 一 个 基于 复合 数据 类 型 的 数组 。 
@ 定义 一 个 名 为 了 的 子 查询 ， 可 以 从 中 查 出 记录 。 


PostgreSQL 9.3 版 提供 了 一 个 名 为 json_agg 的 函数 ,该 函数 的 效果 相当 于 上 面 示 例 中 
array_to_json 和 array_agg 联 用 的 效果 ， 但 json_agg 执行 速度 更 快 。 在 示例 7-17 中 ,我 
们 使 用 json_agg 改写 了 示例 7-16 中 的 语句 ， 二 者 的 输出 是 相同 的 。 


示例 7-17: 使 用 json_agg 将 查询 结果 转 为 JSON 格式 
SELECT json_agg(f) As cats 
FROM ( 
SELECT MAX(fact_ type_id) As max_type, category 
FROM census.Lu_fact_types 
GROUP BY category 
) As ff; 




















7.2.11 DO 

D0 命令 可 以 执行 一 个 基于 过 程 化 语言 的 匿名 代码 段 。 在 下 面 的 示例 中 ， 我 们 将 演示 如 何 通 
过 执行 一 个 匿名 代码 段 来 将 示例 3-7 中 插入 的 数据 从 中 间 表 加 载 到 产品 表 中 。 例 子 中 的 匿 
名 代码 段 是 用 PL/pgSQL 编写 的 ， 但 你 也 可 以 使 用 别 的 语言 编写 。 




















EE 


示例 7-18 中 生成 了 一 系列 的 INSERT INTO SELECT 语句 ， 然 后 通过 这 些 语句 实现 数据 迁移 ， 
这 些 SQL 还 实现 了 由 列 转 行 的 转换 操作 。 


示例 7-18 中 的 Lu_fact_types 建 表 语句 中 仅 包 含 了 部 分 字段 。 请 从 本 书 附 加 
的 代码 和 数据 资源 包 中 找到 building_census_tables.sql 这 个 脚本 ， 其 中 有 
完整 的 建 表 语句 。 





























示例 7-18: 使 用 D0 命令 来 生成 动态 SQL 

set search_path=census; 

DROP TABLE IF EXISTS Lu_fact_types; 

CREATE TABLE Lu_fact_types ( 
fact_type_id serial, 
category varchar(100), 
fact_subcats varchar(255)[]， 
short_name varchar(50) ， 
CONSTRAINT pk_Lu_fact_types PRIMARY KEY(fact_type_id) 


); 
DO Language plpgsql 
$$ 
DECLARE var_sql text; 
BEGIN 
var_sql := string_agg( 
'INSERT INTO lu_fact types(category, fact_subcats, short_name) 
SELECT 
''Housing'', 
array_agg(s' || lpad(i::text,2,'0') || ') As fact_subcats, 
' || quote literal('s' || lpad(i::text,2,'0')) || ' As short_name 
FROM staging.factfinder_import 
WHERE s' || lpad(I::text,2,'0') || ' ~ ''^[a-zA-Z]+'' '， 
) 
FROM generate_series(1,51) As I; © 
EXECUTE var_sql; @ 
END 
$$; 


@ 使 用 string_agg 函数 让 一 组 SQL 语句 形成 单一 字符 串 的 形式 INSERT INTO Lu_fact_ 


type(...) SELECT ... WHERE sO01 ~ '[a-zA-Z]+';。 


@ 执行 该 SQL。 


7.3 适用 于 聚合 操作 的 FILTER 子 名 


9.4 版 中 新 引入 了 用 于 聚合 操作 的 FILTER 子 句 ， 这 是 近期 ANSI SQL 标准 中 新 加 入 的 一 个 


聚合 操作 的 语 


关键 字 。 该 关键 字 用 于 替代 同 为 ANSI SQL 标准 语法 的 CASE WHEN 子 句 ， 使 





法 得 以 简化 。 例 如 ， 假 设 你 需要 使 用 CASE WHEN 子 句 来 统计 每 个 学 生 不 同 科 目的 多 次 测试 





的 平均 成 绩 ， 语 法 如 下 。 


示例 7-19: 在 AVG 聚合 函数 中 使 用 CASE WHEN 
SELECT student, 


AVG(CASE WHEN subject ='algebra' THEN score ELSE NULL END) As algebra, 
AVG(CASE WHEN subject ='physics' THEN score ELSE NULL END) As physics 


FROM test_scores 
GROUP BY student; 








用 FILTER 子 句 可 以 实现 与 上 面 语 句 等 价 的 效果 ， 语 法 如 示例 7-20 所 示 。 
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示例 7-20: AVG 聚合 国 数 与 FILTER 子 句 的 配合 使 用 
SELECT student， 
AVG(score) FILTER (WHERE subject 
AVG(score) FILTER (WHERE subject 
FROM test_scores 
GROUP BY student; 


'algebra') As algebra, 
'physics') As physics 





对 于 求 平均 值 、 求 合计 值 以 及 其 他 很 多 聚合 函数 来 说 ，CASE 和 FILTER 子 句 是 等 价 的 ， 即 
二 者 可 以 起 到 相同 的 作用 。FILTER 子 句 的 优势 在 于 写法 比较 清晰 简洁 并 且 操 作 大 数据 量 时 
速度 比较 快 。CASE 语句 对 于 筛选 掉 的 字段 值 是 当成 NULL 处 理 的 ， 因 此 对 于 array_agg 这 种 
会 处 理 NULL 值 的 聚合 函数 来 说 ， 使 用 CASE WHEN 子 句 就 不 止 是 写法 繁琐 的 问题 了 ， 还 会 
致 输出 不 想 要 的 结果 。 在 示例 7-21 中 ， 我 们 使 用 CASE.. .WHEN... 方法 查询 每 个 学 生 的 各 
门 课程 的 多 次 测试 成 绩 的 列表 来 向 你 演示 这 个 问题 。 



































示例 7-21: CASE WHEN 子 句 与 array_agg 函数 配合 使 用 


SELECT student， 
array_agg(CASE WHEN subject 
array_agg(CASE WHEN subject 
FROM test_scores 
GROUP BY student; 


"aLgebra' THEN score ELSE NULL END) As algebra, 
"physics' THEN score ELSE NULL END) As physics 


student | aLgebra | physics 

ee Cn 
jojo | {74,NULL,NULL,NULL,74,..} | {NULL,83,NULL,NULL,NULL,79,..} 
jdoe | {75,NULL,NULL,NULL,78,..} | {NULL,72,NULL,NULL,NULL,72..} 
robe | {68,NULL,NULL,NULL,77,..} | {NULL,83,NULL,NULL,NULL,85,..} 
lhsu | {84,NULL,NULL,NULL,80,..} | {NULL,72,NULL,NULL,NULL,72,..} 
(4 rows) 











可 以 看 到 上 面 输出 的 成 绩 列表 中 含有 很 多 的 NULL 值 。 这 个 问题 可 以 通过 使 用 子 查询 来 解 
决 ， 但 比 起 使 用 FILTER 来 说 还 是 麻烦 又 低 效 。 示 例 7-22 中 演示 了 使 用 FILTER 时 的 写法 。 




















示例 7-22: FILTER 子 句 与 array_agg 函数 的 配合 使 用 


SELECT student, 
array_agg(score) FILTER (WHERE subject 
array_agg(score) FILTER (WHERE subject 
FROM test_scores 
GROUP BY student; 


'algebra') As algebra, 
'physics') As physics 


student | algebra | physics 


ee Ne 
jojo | {74,74} | {83,79} 
jdoe | {75,78} | {72,72} 
robe | {68,77} | {83,85} 
lhsu | {84,80} | {72,72} 


FILTER 子 句 适用 于 所 有 聚合 函数 ， 不 仅仅 是 PostgreSQL 中 内 置 的 那些 聚合 函数 ， 通 过 安 
装 扩展 包 支 持 的 聚合 国 数 也 是 可 以 用 的 。 





大 
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7.4 窗口 函数 


PostgreSQL 从 8.4 版 开始 支持 ANSI SQL 标准 中 规定 的 窗口 函数 特性 。 通 过 使 用 窗口 函数 ， 
可 以 在 当前 记录 行 中 访问 到 与 其 存在 特定 关系 的 其 他 记录 行 ， 相 当 于 在 每 行 记录 上 都 开 了 
一 个 访问 外 部 数据 的 窗口 ， 这 也 是 “窗口 国 数 ”这 个 名 称 的 由 来 。 窗口 ”就 是 当前 行 可 
见 的 外 部 记录 行 的 范围 。 通 过 窗口 函数 可 以 把 当前 行 的 “窗口 ”区 域内 的 记录 的 聚合 运算 
结果 附加 到 当前 记录 行 。row_number 和 rank 这 类 窗口 函数 能 够 基于 窗口 区 的 数据 实现 对 记 
录 行 的 复杂 排序 。 


如 果 不 借助 窗口 函数 而 又 想 要 达到 相同 的 效果 ， 就 只 能 使 用 关联 操作 和 子 查 询 来 实现 。 表 
面 上 看 ， 使 用 窗口 函数 违背 了 SQL 语言 “基于 结果 集 ” 的 编程 思想 ， 因 为 它 为 每 一 行 数据 
拓展 出 了 一 个 外 部 数据 域 。 但 从 另外 一 个 角度 看 ， 我 们 可 以 认为 窗口 国 数 本 质 上 仅 是 一 种 
用 来 替代 关联 操作 和 子 查询 的 简写 语法 ， 也 就 是 说 窗口 函数 并 未 突破 SQL 体系 原 有 的 运算 
逻辑 ， 那 么 这 样 就 不 算是 违反 了 “基于 结果 集 ” 的 思想 。 你 可 以 从 PostgreSQL 官方 手册 的 
“窗口 函数 ”这 一 节 (http://www.postgresql.org/docs/current/interactive/tutorial-window.html) 


中 看 到 更 多 说 明和 示例 。 


示例 7-23 中 通过 一 个 简单 的 例子 来 帮助 你 理解 窗口 函数 的 基本 概念 。 通 过 使 用 窗口 函数 ， 
我 们 可 以 在 单个 SELECT 语句 中 同时 获取 到 符合 fact_type_id=86 条 件 的 记录 的 均值 计算 结 
有 果 以 及 原始 记录 的 详细 信息 。 请 注意， 语句 执行 时 总 是 先 筛 选 WHERE 条 件 再 计算 窗口 函数 
的 ， 因 为 这 样 显然 可 以 避免 做 无 用 功 。 


示例 7-23: 基本 的 窗口 函数 
SELECT tract_id, val, AVG(val) OVER () as val_avg 
FROM census.facts 
WHERE fact_type_id = 86; 











































































































tract_id | val | val_avg 
es Et ee 三 
25001010100 | 2942.000 | 4430.0602165087956698 
25001010206 | 2750.000 | 4430.0602165087956698 
25001010208 | 2003.000 | 4430.0602165087956698 
25001010304 | 2421.000 | 4430.0602165087956698 

















OVER 子 句 限定 了 窗口 中 的 可 见 记录 范围 。 本 例 中 的 OVER 子 句 未 设 定 任何 条 件 ， 因 此 从 该 
窗口 中 能 看 见 全 表 所 有 记录 ， 所 以 AVERAGE 运算 的 结果 就 是 表 中 所 有 符合 fact_type_id=86 
条 件 的 记录 中 val 字段 的 平均 值 。 你 可 以 看 到 ， 通 过 为 其 增加 OVER 子 句 ， 我 们 把 一 个 传统 
的 AVG 聚合 运算 函数 转变 成 了 一 个 窗口 函数 。PostgreSQL 在 遍历 每 一 行 记录 时 都 会 基于 
全 表 记 录 进 行 一 次 AVG 运算 ， 然 后 将 得 到 的 均值 作为 当前 行 的 一 个 字段 输出 。 由 于 窗口 
数据 域内 包含 多 条 记录 ， 这 意味 着 窗口 函数 运算 的 结果 一 定 会 在 多 条 记录 上 都 是 重复 的 。 
事实 上 ， 窗 口 函 数 实现 了 无 需 GROUP BY 的 聚合 运算 ， 还 实现 了 无 需 JOIN 的 关联 操作 ， 从 
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而 将 窗口 函数 的 运算 结果 回填 到 记录 行 中 。 





所 有 SQL 聚合 国 数 都 可 以 通过 增加 OVER 子 句 的 方式 来 当 作 窗 口 函数 使 用 。 除 了 这 些 双重 
身份 的 函数 之 外 ， 系 统 中 还 有 RON、RANK、LEAD 等 专门 的 窗口 函数 ， 你 可 以 从 PostgreSQL 
官方 手册 的 “窗口 函数 ”一 节 (http://www.postgresql.org/docs/current/interactive/functions- 
window.html) 中 看 到 完整 的 窗口 函数 列表 。 

















7.4.1 PARTITION BY 子 句 


窗口 国 数 的 窗口 可 见 记录 范围 是 可 设置 的 ， 可 以 是 全 表 记 录 ， 也 可 以 是 与 当前 行 有 关联 关 
系 的 特定 记录 行 。 窗 口 可 见 记录 范围 的 设置 是 通过 PARTITION BY 子 句 实现 的 ， 它 可 以 指示 
PostgreSQL 仅 在 满足 条 件 的 特定 记录 集 上 执行 聚合 操作 。 示 例 7-24 的 查询 与 示例 7-23 类 
似 ， 但 要 求 各 县 级 编号 作为 窗口 筛选 条 件 ， 该 编号 就 是 tract_id 的 前 5 个 字符 。 



































示例 7-24: 使 用 县 级 编号 作为 窗口 可 见 记录 范围 的 筛选 条 件 
SELECT tract_id, val, AVG(val) OVER (PARTITION BY left(tract id,5)) As val_avg_coun 


ty 
FROM census .facts WHERE fact type_ id = 2 ORDER BY tract _ id; 


tract_id | val | val_avg_county 

es Ne ee er 
25001010100 | 1765.000 | 1709.9107142857142857 
25001010206 | 1366.000 | 1709.9107142857142857 
| 984.000 | 1709.9107142857142857 


25001010208 


25003900100 | 1920.000 | 1438.2307692307692308 
25003900200 | 1968.000 | 1438.2307692307692308 
25003900300 | 1211.000 | 1438.2307692307692308 








(请 注意 : 为 了 节约 版 面 ， 上 面 仅 截取 了 完整 输出 的 部 分 内 容 。) 











7.4.2 ”ORDER BY 子 句 


窗口 函数 的 OVER 子 句 中 还 可 以 使 用 ORDER BY 子 句 ， 甚 作用 可 以 理解 为 对 窗口 可 见 范围 内 
的 所 有 记录 进行 排序 ， 并 且 窗 口 可 见 记 录 域 是 从 结果 集 的 第 一 条 记录 开始 到 当前 记录 为 止 
的 范围 内 。 该 语法 的 典型 应 用 场景 就 是 用 ROW_NUMBER 函数 对 记录 集 进行 编号 。 在 示例 7-25 
中 ， 我 们 演示 了 如 何 对 各 人 口 普查 区 记录 按照 其 名 称 顺序 进行 编号 。 



































示例 7-25: 使 用 ROW_NUMBER 窗口 函数 进行 编号 操作 
SELECT ROW_NUMBER() OVER (ORDER BY tract_name) As rnum，tract_name 
FROM census.Lu_tracts 
ORDER BY rnum LIMIT 4; 


rnum | tract_name 





和 | Census Tract 1, Suffolk County, Massachusetts 

2 | Census Tract 1001, Suffolk County, Massachusetts 
3 | Census Tract 1002, Suffolk County, Massachusetts 
4 | Census Tract 1003, Suffolk County, Massachusetts 


示例 7-25 中 有 两 个 ORDER BY， 前 一 个 在 OVER 子 句 内 生效 ， 表 明 窗 口 可 见 区 内 的 记录 顺序 ， 
后 一 个 针对 整 名 生效， 表明 返回 记录 的 整体 顺序 。 请 不 要 将 二 者 的 作用 域 混淆 。 





PARTITION BY 和 ORDER BY 可 以 联 用 ， 其 效果 就 是 对 PARTITION BY 指定 的 记录 集 进 行 排序 
示例 7-26 还 是 复 用 了 前 面 的 例子 ， 但 在 ovER 子 句 中 联 用 了 PARTITION BY 和 ORDER BY。 


示例 7-26: 联 用 PARTITION BY 和 ORDER BY 


SELECT tract_id, val, 
SUM(val) OVER (PARTITION BY Left(tract_id,5) ORDER BY val) As sum_county_ordered 
FROM census .facts 
WHERE fact type id = 2 
ORDER BY Left(tract id,5), val; 


tract id | val | sum_county_ordered 
Se ee 
25001014100 | 226.000 | 226.00 
25001011700 | 971.000 | 1197.000 
25001010208 | 984.000 | 2181.000 
25003933200 | 564.000 | 564.000 
25003934200 | 593.000 | 1157.000 


25003931300 | 606.000 | 1763.000 





可 以 看 到 上 面 输出 的 合计 值 是 逐 行 累加 的 ， 这 就 是 在 OVER 子 句 中 应 用 了 ORDER BY 后 的 效 
果 ， 即 窗口 可 见 域 是 从 排序 后 的 记录 集 的 头条 记录 开始 ， 到 ORDER BY 字段 值 与 当前 记录 值 
匹配 的 那 行 记 录 为 止 ， 因 此 最 终 会 呈现 为 动态 累加 的 效果 。 例 如 ， 对 于 第 三 个 数据 分 区 中 
的 第 五 条 记录 来 说 ， 合 计 值 仅 会 包含 该 分 区 中 的 前 五 条 记录 的 值 。 在 上 面 的 示例 中 ， 我 们 
在 语句 的 最 后 加 上 了 ORDER BY left(tract_id,5)，val 这 个 排序 动作 ， 因 此 动态 累加 效果 
一 目 了 然 。 但 请 一 定 要 牢记 ，OVER 子 句 中 的 ORDER BY 与 整 句 尾部 的 ORDER BY 的 作用 是 完 
全 不 同 的 。 









































你 还 可 以 通过 RANGE 或 者 ROWS 关键 字 来 显 式 指定 窗口 的 可 见 记录 域 。 例 如 : RONS BETWEEN 
CURRENT ROW AND 5 FOLLOWING, 








PostgreSQL 还 支持 建立 命名 窗口 ， 该 功能 适用 于 在 同一 个 查询 中 使 用 了 多 个 窗口 国 数 上 且 每 
个 窗口 函数 的 窗口 定义 都 相同 的 情况 。 示 例 7-27 演示 了 建立 命名 窗口 的 方法 ， 同 时 还 展示 
了 LEAD 和 LAG 窗口 函数 的 用 法 ， 这 两 个 窗口 函数 可 以 取出 当前 窗口 中 排 在 当前 记录 行 之 前 
或 者 之 后 的 记录 。 
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示例 7-27: 命名 窗口 以 及 LEAD 和 LAG 函数 的 用 法 
SELECT * FROM( 
SELECT 
ROW_NUMBER() OVER( wt ) As rnum，@ 
substring(tract id,1, 5) As county_code， 
tract_id, 
LAG(tract_id,2) OVER wt As tract 2_before, 
LEAD(tract id) OVER wt As tract_after 
FROM census.Lu_tracts 
WINDOW wt AS (PARTITION BY substring(tract id,1, 5) ORDER BY tract id) @ 
) As x 
WHERE rnum BETWEEN 2 and 3 AND county_code IN ('25007','25025') 
ORDER BY county_code, rnum; 


rnum | county_code | tract id | tract_2_before | tract_after 
----- +-------------+-------------+----------------+------------- 
2 | 25007 | 25007200200 | | 25007200300 
3 | 25007 | 25007200300 | 25007200100 | 25007200400 
2 | 25025 | 25025000201 | | 25025000202 
3 | 25025 | 25025000202 | 25025000100 | 25025000301 


@ 直接 复 用 窗口 名 ， 而 不 需要 把 窗口 的 完整 定义 再 输 一 过 。 
@ 将 我 们 的 窗口 命名 为 wt 窗口 。 








LEAD 和 LAG 函数 都 有 一 个 可 选 的 step 实 参 ,该 实 参 可 以 是 正 数 也 可 以 是 负数 ， 代 表 需 要 
从 当前 记录 开始 向 前 或 者 向 后 跳 儿 条 记录 才能 访问 到 目标 记录 。 当 LEAD 和 LAG 在 寻找 目标 
记录 的 过 程 中 跳出 了 当前 窗口 的 可 见 域 时 ， 就 会 返回 NULL。 这 种 情况 是 经 常会 遇 到 的 。 




















请 注意 : 在 PostgreSQL 中 ， 系 统 自 带 的 以 及 用 户 自 定义 的 聚合 国 数 都 可 以 作为 窗口 国 
使 用 ， 但 其 他 数据 库 一 般 仅 支持 AVG6、SUM、MIN、MAX 这 些 系统 内 置 聚 合 国 数 作为 窗口 
数 使 用 。 


加 涝 











7.5 CTE 表达 式 


公用 表 表 达 式 (CTE) 本 质 上 来 说 就 是 在 一 个 非常 庞大 的 SQL 语句 中 允许 用 户 通过 一 个 子 
查询 语句 先 定 义 出 一 个 临时 表 ， 然 后 在 这 个 庞大 的 SQL 语句 的 不 同 地 方 都 可 以 直接 使 用 
这 个 临时 表 。PostgreSQL 从 8.4 版 开始 支持 此 特性 ， 从 9.1 版 开始 又 扩展 支持 了 可 写 CTE， 
从 而 使 得 CTE 功能 得 到 进一步 的 完善 。CTE 本 质 上 就 是 当前 语句 执行 期 间 内 有 效 的 临时 
表 , 一 旦 当前 语句 执行 完毕 ， 其 内 部 的 CTE 表 也 随 之 失效 。 


有 以 下 三 种 类 型 的 CTE。 




















。 基本 CTE 
这 是 最 普通 的 CTE， 它 可 以 使 得 SQL 语句 的 可 读 性 更 高 ， 同 时 规划 器 在 解析 到 这 种 
CTE 时 会 判定 其 查询 代价 是 否 很 高 ， 如 果 是 的 话 ， 会 考虑 将 其 查询 结果 临时 物化 存储 
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下 来 此 处 概念 跟 物化 视图 非常 类 似 )， 这 样 整个 SQL 语句 的 其 他 部 分 再 访问 此 CTE 
时 就 会 更 快 。 








。 可 写 CTE 
这 是 对 基本 CTE 的 一 个 功能 扩展 ， 其 内 部 可 以 执行 UPDATE、INSERT 或 者 DELETE 操作 。 
该 类 CTE 最 后 一 般 会 返回 修改 后 的 记录 集 。 








。 递归 CTE 
该 类 CTE 在 普通 CTE 的 基础 上 增加 了 一 个 循环 操作 。 在 执行 过 程 中 ， 递 归 CTE 返回 
的 结果 集会 有 所 变化 。 











PostgreSQL 支持 可 写 的 递归 CTE 这 种 复合 类 型 。 





7.5.1 基本 CTE 用 法 介绍 
基本 CTE 的 用 法 如 示例 7-28 所 示 。WITH 关键 字 后 跟着 的 就 是 CTE 表达 式 。 


示例 7-28: 基本 CTE 
WITH cte AS ( 
SELECT 
tract_id, substring(tract_id,1, 5) As county_code, 
COUNT(*) OVER(PARTITION BY substring(tract id,1, 5)) As cnt_tracts 
FROM census.Lu_tracts 


) 


SELECT MAX(tract_id) As last tract, county_code, cnt_tracts 
FROM cte 

WHERE cnt_tracts > 100 

GROUP BY county_code, cnt_tracts; 


示例 7-28 中 CTE 表达 式 的 名 称 是 cte， 其 本 体 是 由 一 个 SELECT 语句 定义 出 来 的 ， 查 询 字 
段 列 表 中 包含 tract_id、country_code、cnt_tracts 三 个 列 。 外 围 的 SQL 语句 会 将 该 CTE 
作为 一 个 临时 表 来 使 用 。 


单个 SQL 语句 中 可 以 创建 多 个 CTE，CTE 之 间 使 用 喜 号 分 隔 ， 所 有 的 CTE 表达 式 都 要 落 
在 NITH 子 名 范围 内 ， 有 具体 语法 如 示例 7-29 所 示 。 多 个 CTE 表达 式 之 间 的 顺序 不 是 随便 排 
的 ， 排 在 后 面 的 CTE 可 以 引用 排 在 前 面 的 CTE， 但 反 过 来 不 行 。 除 了 这 一 点 以 外 ， 多 个 
CTE 之 间 的 排列 顺序 没有 别 的 讲究 。 


示例 7-29: 多 个 CTE 的 用 法 
WITH 
Cte1 AS( 

SELECT 
tract_id, 
substring(tract id,1, 5) As county_code， 
COUNT(*) OVER (PARTITION BY substring(tract id,1,5)) As cnt_tracts 

FROM census.lu_ tracts 
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MAX(tract_ id) As Last_tract， 
county_code, 
cnt_tracts 
FROM ctel 
WHERE cnt_tracts < 8 GROUP BY county_code, cnt_tracts 
) 
SELECT c.last_ tract, f.fact_type_id, f.val 
FROM census.facts As f INNER JOIN cte2 c ON f.tract id = c.last_tract; 


7.5.2 ”可 写 CTE 用 法 介绍 


可 写 


CTE 是 从 9.1 版 开始 支持 的 一 个 特性 ， 它 扩展 了 CTE 的 功能 范畴 ， 从 只 读 扩展 为 可 





写 。 我 们 下 面 使 用 示例 6-2 中 创建 的 日 志 表 来 演示 此 功能 。 首 先 创建 一 个 子 表 : 

















人 





CREATE TABLE logs 2011 01 02 ( 
PRIMARY KEY (log_id), 
CONSTRAINT chk 
CHECK (log_ ts >= '2011-01-01' AND log ts < '2011-03-01') 
) 
INHERITS (logs_2011); 


在 示例 7-30 中 ， 我 们 将 父 表 的 部 分 数据 迁移 到 子 表 中 。 父 表 包 含 了 2011 年 全 年 的 数据 ， 
子 表 包 含 了 2011 年 1 月 和 2 月 的 数据 。 下 面 的 语句 中 使 用 的 ONLY 关键 字 在 7.2.7 节 中 有 相 
关 介 绍 ， 而 RETURNING 关键 字 在 7.2.9 节 中 有 相关 介绍 。 


示例 7-30: 使 用 可 写 CTE 将 数据 从 一 个 分 支 移动 到 另 一 个 分 支 




















NITH t AS ( 
DELETE FROM ONLY Logs_2011 WHERE log ts < '2011-03-01' RETURNING * 


INSERT INTO Logs_2011_01 02 SELECT* FROM 七 ; 


7.5.3 ”递归 CTE 用 法 介绍 
PostgreSQL 官方 手册 中 对 递归 CTE 做 了 最 好 的 说 明 :“ 通 过 新 增 一 个 可 选 的 RECURSIVE 修 
饰 符 ， 使 CTE 从 仅仅 能 提供 一 些 语法 便利 升华 为 能 够 实现 标准 SQL 语法 无 法 实现 的 功 


会 已 » 


月 E 。 











递归 CTE 能 够 使 用 递归 语法 构造 出 一 个 表达 式 ， 这 一 点 很 有 意思 。 递 归 CTE 使 用 





UNION ALL 语法 来 实现 每 次 运算 过 程 中 的 运算 结果 的 递归 累积 。 


如 果 要 将 一 个 基本 CTE 转换 为 递归 CTE， 需 要 在 WITH 后 加 上 RECURSIVE 修饰 符 。WITH 


RECURSIVE 后 











鲁 可 以 附带 由 递归 表达 式 和 非 递 归 表 达 式 结合 而 成 的 语句 。 在 大 多 数 其 他 数 














据 库 中 ， 如 果 要 表达 递归 关系 ， 并 不 需要 显 式 指定 RECURSIVE 关键 字 。 





递归 








CTE 常用 于 表达 树 状 结构 。 我 们 在 “使 用 递归 CTE 来 显示 树 状 结构 ”这 篇 博 


文 (http://www.postgresonline.com/journal/archives/131-Using-Recursive-Common-table- 





140 


| A 


第 7 章 








expressions-to-represent-Tree-structures.html) 中 提供 了 一 个 这 方面 的 例子 。 








在 示例 7-31 中 ， 我 们 通过 查询 系统 catalog 来 展示 数据 库 中 的 级 联 表 关系 。 








示例 7-31: 递归 CTE 
WITH RECURSIVE tbls AS ( 

SELECT 
c.oid As tabLeoid ， 
n.nspname AS schemaname， 
c.relname AS tabLename © 

FROM 
pg_class C LEFT JOIN 
pg_namespace n ON n.oid = c.relnamespace LEFT JOIN 
pg_tablespace t ON t.oid = c.reltablespace LEFT JOIN 
pg_inherits As th ON th.inhrelid = c.oid 


WHERE 

th.inhrelid IS NULL AND 

c.relkind = 'r'::"char" AND c.relhassubclass 
UNION ALL 
SELECT 


c.oid As tabLeoid ， 

n.nspname AS schemaname, 

tbLs .tabLename || '->' || c.relname AS tablenane 四 日 
FROM 

tbLs INNER JOIN 

pg_inherits As th ON th.inhparent = tbls.tableoid INNER JOIN 

pg_class c ON th.inhrelid = c.oid LEFT JOIN 

pg_namespace n ON n.oid = c.relnamespace LEFT JOIN 
pg_tablespace t ON t.oid = c.reltablespace 



























































) 
SELECT * FROM tbls ORDER BY tablename; @ 
tableoid | schemaname | tablename 
2 | obile oon 
3152260 | public | Logs->Logs_2011 
3152272 | public | Logs->Logs_2011->Logs_2011 01_02 
@ 查询 出 所 有 有 子 表 而 无 父 表 的 表 。 
@ 这 是 递归 查询 部 分 ， 查 询 出 了 所 有 位 于 tbls 临时 表 中 的 表 的 子 表 。 
@ 输出 时 在 父 表 名 之 后 附加 子 表 的 名 称 。 
@ 输出 父 表 和 所 有 子 表 。 因 为 语句 中 要 求 输出 结果 按照 表 名 排序 ， 而 每 一 层级 的 表 名 是 
将 父 表 的 名 称 排 在 子 表 之 前 ， 因 此 排序 后 的 效果 就 是 子 表 记 录 紧 跟 在 其 父 表 记 录 之 后 


输出 。 


7.6 ”LATERAL 横 向 关联 语法 


LATERAL 是 9.3 版 本 中 新 支持 的 ANSI SQL 标准 语法 。 该 语法 的 用 途 是 : 假设 你 需要 对 两 张 
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表 或 者 两 个 子 查询 进行 关联 查询 操作 ， 那 么 参与 关联 运算 的 双方 是 独立 的 ， 互 相 不 能 读 取 
对 方 的 数据 。 例 如 ， 下 面 的 查询 语句 会 报错 ， 因 为 L.year=2911 不 是 位 于 关联 的 右 侧 的 一 
个 列 。 


SELECT 
FROM 
census.facts L 
INNER JOIN 
(SELECT * 
FROM census.Lu_fact_types 
WHERE category = 
CASE WHEN L.yr = 2011 THEN 'Housing' ELSE category END 
)R 


ON L.fact_ type id = R.fact type_id; 
加 上 了 LATERAL 关键 字 后 就 不 会 再 报错 : 


SELECT * FROM census.facts L INNER JOIN LATERAL 
(SELECT * FROM census.Lu_fact_types 
WHERE category = CASE WHEN L.yr = 2011 THEN 'Housing' ELSE category END) R 
ON L.fact_type_id = R.fact type id; 


通过 使 用 LATERAL 语法 可 以 在 一 个 FROM 子 句 中 跨 两 个 表 共 享 多 列 中 的 数据 。 但 有 个 限制 就 
是 仅 支 持 单 向 共享 ， 即 右 侧 的 表 可 以 提取 左 侧 表 中 的 数据 ， 但 反 过 来 不 行 。 


有 时 候 为 了 避免 编写 语法 极其 复杂 的 语句 ， 我 们 也 需要 使 用 LATERAL 语法 。 在 示例 7-32 
中 ， 关 联 关 系 中 左 侧 的 一 个 列 充当 了 右 侧 generate_series 函数 的 一 个 形 参 : 

















CREATE TABLE interval_periods(i type interval); 
INSERT INTO interval_periods (i_type) 
VALUES ('5 months'), ('132 days'), ('4862 hours'); 


示例 7-32: LATERAL 语法 和 generate_series 国 数 的 关联 使 用 


SELECT i type, dt 
FROM 
interval_periods CROSS JOIN LATERAL 
generate_series('2012-01-01'::date, '2012-12-31'::date, i type) AS dt 
WHERE NOT (dt = '2012-01-01' AND i_type = '132 days'::interval); 
i type | dt 


+ 
| 2012-01-01 00:00:00-05 
5 mons | 2012-06-01 00:00:00-04 
| 
| 
| 


5 mons 2012-11-01 00:00:00-04 
132 days 2012-05-12 00:00:00-04 
132 days 2012-09-21 00:00:00-04 


4862:00:00 | 2012-01-01 00:00:00-05 
4862:00:00 | 2012-07-21 15:00:00-04 


LATERAL 语法 还 可 用 于 以 下 场景 : 通过 关联 关系 左 侧 的 数据 来 限制 右 侧 的 查询 结果 集中 包 
含 的 记录 数量 。 在 示例 7-33 中 ， 我 们 使 用 LATERAL 语法 查询 出 最 近 100 天 之 内 登录 过 我 们 














大 
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网 站 (http:Wwww.postgresonline.com) 的 超级 用 户 最 近 5 次 登录 的 时 间 和 操作 日 志 。 本 例 
中 使 用 的 表 是 在 6.1.4 节 和 6.1.1 节 中 创建 的 。 


示例 7-33: 使 用 LATERAL 语法 来 限制 关联 查询 中 的 一 方 返回 的 记录 数 
SELECT Uy.user_name, l.description, l.log ts 
FROM 
super_users AS U CROSS JOIN LATERAL ( 
SELECT description, log_ts 
FROM logs 
WHERE 
Log_ts > CURRENT_TIMESTAMP - interval '100 days' AND 
Logs.User_name = U.User_name 
ORDER BY Log_ts DESC LIMIT 5 
) AS 1L; 


虽然 你 也 可 以 通过 窗口 函数 来 实现 相同 的 效果 ， 但 LATERAL 关联 执行 速度 更 快 ， 语 法 也 更 


在 同一 条 SQL 语句 中 可 以 多 次 使 用 LATERAL 关联 ， 当 需要 关联 多 个 子 查询 时 ， 甚 至 可 以 级 
联 使 用 LATERAL。 在 有 的 场景 下 可 以 省 略 LATERAL 关键 字 ， 此 时 规划 器 会 根据 关联 关系 的 两 
边 交 又 引用 的 情况 来 智能 判断 出 这 是 一 个 LATERAL 操作 。 但 我 们 还 是 建议 你 ， 为 了 清晰 起 
见 ， 最 好 是 显 式 指定 LATERAL 关键 字 。 在 不 支持 LATERAL 语法 的 PostgreSQL 版 本 上 执行 带 
横向 引用 的 SQL 语句 当然 会 报错 。 不 显 式 指明 LATERAL 关键 字 还 有 一 个 风险 ， 就 是 可 能 会 
造成 规划 器 误 判 ， 最 终生 成 的 执行 计划 可 能 完全 不 是 你 想 要 的 。 


其 他 数据 库 中 也 提供 了 横向 关联 的 能 力 ， 但 其 语法 不 符合 ANSI SQL 规范 的 要 求 。 在 
Oracle 中 ， 横 向 关联 通过 管道 函数 实现 ， 在 SQL Server 中 使 用 CROSS APPLY 或 者 OUTER 
APPLY 语法 来 实现 。 




















PostgreSQL 的 特色 SQL 语法 | 143 











在 大 多 数 数据 库 中 ， 你 都 可 以 把 若干 SQL 语句 组 合 在 一 起 然后 将 其 作为 一 个 单元 来 处 理 。 
PostgreSQL 也 支持 这 种 能 力 。 这 种 机 制 在 不 同 数据 库 中 的 名 称 不 一 样 ， 有 的 叫 存 储 过 程 ， 
有 的 叫 用 户 自 定义 函数 等 名 称 ， 而 PostgreSQL 统一 称 之 为 函数 。 














函数 不 是 仅仅 将 一 堆 SQL 语句 编排 在 一 起 即 可 ， 其 中 还 需要 使 用 过 程 化 语言 (Procedural 
Language，PL) 来 对 SQL 语句 的 执行 过 程 进行 控制 。 

















在 PostgreSQL 中 ， 你 可 以 选择 使 用 不 同 的 语言 来 编写 函数 ， 可 选择 的 语言 有 很 多 ， 其 
中 SQL、C、PL/pgSQL、PL/Perl 以 及 PL/Python 一 般 都 会 随 PostgreSQL 安装 包 附 带 。 从 
PostgreSQL 9.2 版 开始 新 增 了 对 PL/V8 语言 的 支持 ， 通 过 它 你 可 以 使 用 JavaScript 语言 3 
编写 函数 。 对 于 Web 应 用 的 开发 人 员 来 说 ， 引 入 对 PL/V8 的 支持 是 很 令 人 激动 的 一 件 事 
情 ， 因 为 JSON、JSONB 数据 类 型 和 JavaScript 语言 是 绝 配 。 内 置 的 json 和 jsonb 数据 类 
型 在 5.6 市 中 进行 过 介绍 。 








你 可 以 按 需 安装 PL/R、PL/Java、PL/sh、PL/TSQL 等 语言 扩展 ， 此 外 还 有 一 些 用 于 高 端 逻 
辑 处 理 以 及 人 工 智 能 处 理 的 试验 性 语言 ， 比 如 PL/Scheme 和 PL/OpenCL 等 。 你 可 以 在 官 
方 手册 的 “过 程 化 语言 ”这 一 节 (http:/www.postgresql.org/docs/current/interactive/external- 
pl.html) 中 查 到 PostgreSQL 支持 的 完整 语言 列表 。 
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8.1 ” PostgreSQL 函数 功能 剖析 


8.1.1 函数 功能 基础 知识 介绍 





在 PostgreSQL 中 ， 不 管 你 选择 使 用 何 种 编程 语言 ， 所 编写 出 来 的 函数 的 结构 都 是 类 似 的 ， 


如 示例 8-1 所 示 。 


示例 8-1: 函数 的 基本 结构 


CREATE OR REPLACE FUNCTION func_name(arg1 arg1 datatype DEFAULT arg1_default) 
RETURNS some type / set of some type | TABLE (..) As 

$$ 

BODY of function 

$$ 

LANGUAGE language of _function 


函数 的 实 参 列表 中 可 以 只 有 实 参 类 型 而 没有 实 参 名 ,但 如 果 不 写实 参 名 的 话 ， 你 就 不 能 使 
用 类 似 arg1:=.…. 这 种 语法 来 为 实 参 赋值 。 实 参 是 可 选 的， 也 就 是 说 调用 函数 时 可 以 不 填 
实 参 值 ， 如 有 果 不 填 的 话 系统 就 会 自动 为 其 赋 一 个 默认 值 。 设 计 函 数 时 ， 在 其 实 参 列表 中 应 
将 可 选 实 参 排 在 必 选 实 参 之 后 。 


定 











义 函数 时 可 以 添加 一 些 标记 符 来 优化 执行 效率 或 者 提升 安全 性 ， 支 持 的 标记 符 列表 如 下 。 


LANGUAGE (使 用 的 编程 语言 ) 
名 明 本 函数 使 用 的 编程 语言 ， 当 然 该 语言 必须 在 当前 函数 所 在 的 database 中 已 安装 。 执 
行 SELECT Lanname FROM pg_Language; 即 可 查 到 已 安装 的 语言 列表 。 








VOLATILITY (结果 的 稳定 性 ) 
该 标记 符 可 以 告诉 查询 规划 器 当 该 函数 执行 完毕 后 得 到 的 结果 是 否 可 以 缓存 下 来 以 供 下 
次 使 用 。 它 有 以 下 几 个 可 选 值 。 

















一 IMMUTABLE (结果 恒定 不 变 ) 
任何 情况 下 ， 只 要 调用 该 函数 时 使 用 相同 的 输入 就 总 会 得 到 相同 的 输出 。 也 就 是 说 该 函 
数 的 内 部 逻辑 对 外 界 完全 无 依赖 。 


一 STABLE (结果 相对 稳定 ) 

如 果 在 同一 个 查询 语句 中 多 次 调用 该 函数 ， 则 每 次 调用 时 只 要 使 用 相同 的 输入 就 总 会 
得 到 相同 的 输出 。 也 就 是 说 该 函数 的 内 部 逻辑 在 当前 SQL 的 上 下 文 环 境内 是 有 恒定 输 
出 的 。 

















一 VOLATILE (结果 不 稳定 ) 
每 次 调用 该 函数 得 到 的 结果 可 能 都 不 同 ， 即 便 每 次 都 使 用 相同 的 输入 也 是 这 样 。 那 
些 更 改 数据 的 函数 或 者 那些 依赖 于 比如 系统 时 间 这 类 环境 设置 的 函数 应 该 被 标记 为 
VOLATILE。 该 项 也 是 默认 值 。 














注意 ，VOLATILITY 标记 符 仅 仅 是 给 规划 器 提供 了 一 个 提示 信息 ， 规 划 器 并 不 一 定 
按照 此 设置 来 进行 处 理 。 如 果 函 数 被 标记 为 VOLATILE， 那 么 规划 器 每 次 过 到 此 函数 都 
重新 解析 并 重新 执行 一 人 遍 ， 如 果 被 标记 为 别 的 类 型 ， 那 么 规划 器 也 有 可 能 不 会 对 其 执 
结果 进行 缓存 ， 因 为 规划 器 可 能 认为 重新 计算 一 遍 反 而 会 更 快 。 
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字 沪 六 下 








一 STRICT (严格 模式 ) 

对 于 一 个 严格 模式 的 函数 来 说 ， 如 果 有 任何 输入 为 NULL， 则 规划 器 根本 不 会 执行 这 个 
国 数 就 直接 返回 NULL。 如 果 未 显 式 指定 为 STRICT 模式 ， 则 函数 默认 都 是 非 严 格 模 式 
的 。 写 函数 时 对 STRICT 限定 符 请 务必 慎 用 ， 因 为 用 了 以 后 可 能 会 导致 规划 器 不 使 用 索 
引 。 请 参考 我 们 的 博文 “SQL 函数 的 严格 模式 ” (http://www.postgresonline.com/journal/ 
archives/163-STRICT-on-SQL-Function-Breaks-In-lining-Gotcha.html) 以 获取 更 多 细节 。 




















。 COST (执行 成 本 估计 ) 
这 是 标记 函数 中 计算 操作 密集 程度 的 一 个 相对 度量 值 。 如 果 使 用 的 是 SQL 或 PL/pgSQL 
语言 ， 则 该 值 为 109; 如果 使 用 C 语言 ， 则 该 值 为 1。 该 值 会 影响 到 规划 器 执行 WHERE 
子 句 中 的 函数 时 的 优先 级 ， 也 会 影响 到 是 否 对 此 函数 进行 结果 集 缓 存 的 可 能 性 判定 。 此 
值 越 大 ， 则 规划 器 会 认为 执行 该 函数 需要 耗费 的 时 间 越 多 。 



































。 ROWS (返回 结果 集 的 行 数 估 计 ) 
仅 当 函数 返回 的 是 一 个 结果 集 时 此 标记 符 才 有 用 。 该 值 是 返回 的 结果 集中 记录 数 的 一 个 
估计 值 。 规 划 器 会 利用 此 数值 来 为 此 函数 分 析 得 出 最 佳 的 执行 策略 。 








。 SECURITY DEFINER (安全 控制 符 ) 
如 果 设 置 了 安全 控制 符 ， 则 会 以 创建 此 函数 的 用 户 的 权限 执行 此 函数 ， 如 果 未 设置 ， 则 
会 以 调用 此 函数 的 用 户 的 权限 执行 此 函数 。 如 果 某 用 户 对 某 张 表 没 有 操作 权限 而 又 需要 
操作 该 表 ， 那 么 就 可 以 让 创建 该 表 的 用 户 提 供 一 个 带 SECURITY DEFINER 标识 的 函数 来 
对 此 表 进 行 操作 。 可 以 看 出 ， 当 需要 进行 表 的 访问 权 控 制 时 ， 这 个 安全 控制 符 还 是 很 有 
用 的 。 


8.1.2 触发 器 和 触发 器 函数 
任何 一 个 功能 健全 的 数据 库 都 支持 触发 器 功能 。 借 助 触发 器 机 制 可 以 实现 自动 捕捉 数据 变 
化 事件 并 进行 相应 处 理 。PostgreSQL 既 支持 对 表 建 触发 器 也 支持 对 视图 建 触发 器 。 






































可 以 指定 触发 吉 在 语句 级 或 者 记录 级 被 触发 。 对 语句 级 触发 器 来 说 ， 每 执行 一 条 SQL 语句 
只 会 被 触发 一 次 ， 对 记录 级 触发 器 来 说 ，SQL 语句 执行 过 程 中 每 修改 一 条 记录 就 会 被 触发 
一 次 。 例 如 ， 假 设 你 对 某 表 执行 了 一 个 UPDATE 语句 ， 更 新 了 1500 条 记录 。 那 么 该 表 上 的 
语句 级 触发 器 只 会 触发 一 次 ， 而 记录 级 触发 器 会 触发 1500 次 。 











你 还 可 以 更 加 精细 化 设置 触发 器 的 触发 时 机 ， 系 统 支 持 BEFORE、AFTER 以 及 INSTEAD OF 这 
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三 种 时 机 。BEFORE 类 的 触发 器 会 在 语句 执行 之 前 或 者 记录 行 被 修改 之 前 触发 ， 你 可 以 借 此 
时 机 来 取消 此 次 修改 或 者 对 要 修改 的 数据 进行 预先 备份 。AFTER 类 的 触发 帮会 在 语句 执行 
之 后 或 者 记录 行 被 修改 之 后 触发 ， 你 可 以 借 此 时 机 来 获得 修改 后 的 新 值 ， 该 类 触发 器 一 般 
用 于 记录 修改 日 志 或 者 进行 数据 复制 。INSTEAD OF 类 的 触发 器 会 将 原 语句 的 操作 内 容 替换 
掉 。BEFORE 和 AFTER 类 型 的 触发 器 只 能 用 于 表 ， 而 INSTEAD OF 类 触发 器 只 能 用 于 视图 。 


你 还 可 以 在 定义 触发 器 时 加 上 WHEN 条 件 来 限定 只 有 那些 满足 了 筛选 条 件 的 记录 被 修改 时 
才 激 活该 触发 器 ， 也 可 以 通过 加 上 “UPDATE 0F+ 字段 列表 ” 子 名 来 指定 只 有 修改 了 特定 的 
列 时 才 激 活该 触发 器 。 如 果 和 希望 更 加 深入 细致 地 了 解 触发 器 与 主体 语句 之 间 的 触发 联动 机 
制 ， 请 参考 PostgreSQL 官方 手册 中 的 “触发 器 行为 概览 ” (http://www.postgresql.org/docs/ 
current/interactive/trigger-definition.html) 一 节 的 内 容 。 我 们 还 在 示例 7-4 中 演示 了 一 个 视图 
触发 器 的 用 法 。 


PostgreSQL 提供 了 一 种 专门 用 于 处 理 触 发 器 逻辑 的 函数 ， 这 类 函数 被 称 为 触发 器 函数 ， 其 
行为 模式 与 其 他 函数 完全 类 似 ， 内 部 的 代码 结构 也 相同 。 触 发 器 函数 与 普通 函数 的 唯一 区 
别 在 于 输入 形 参 和 输出 类 型 。 触 发 器 函数 从 不 需要 实 参 ， 因 为 可 以 在 函数 内 部 访问 数据 并 
对 其 进行 修改 。 






























































触发 器 函数 的 返回 值 永远 是 trigger 类 型 。PostgreSQL 的 触发 器 函数 与 别 的 普通 函数 机 制 
完全 类 似 ， 因 此 一 个 触发 器 函数 可 以 被 多 个 触发 嚣 公用。 几乎 没有 哪 家 数据 库 能 支持 该 特 
性 ， 因 为 一 般 数据 库 中 都 是 把 触发 器 和 触发 器 函数 作为 一 个 完整 的 对 象 绑 定 在 一 起 的 ， 这 
样 的 触发 器 处 理 逻 辑 无 法 被 别 的 触发 器 重用 。 























在 PostgreSQL 中 ， 每 个 触发 器 有 且 仅 有 一 个 配套 的 触发 器 函数 。 如 果 由 于 业务 需要 必须 将 
逻辑 分 散 到 多 个 触发 器 函数 中 ， 那 么 就 得 创建 多 个 触发 器 来 调用 它们 ， 这 些 触发 器 的 触发 
事件 可 以 相同 也 可 以 不 同 ， 如 果 触 发 事件 相同 的 话 ， 那 么 系统 会 将 触发 器 名 称 按 字典 顺序 
进行 排序 ， 然 后 逐个 触发 。 后 面 一 个 触发 器 可 以 看 到 前 面 一 个 触发 器 的 修改 结果 。 每 一 个 
触发 器 并 不 是 一 个 独立 的 事务 ， 因 此 如 果 在 某 个 触发 器 中 执行 了 回 深 操 作 ， 那 么 在 此 触发 
器 之 前 执行 过 的 触发 器 修改 都 会 被 回 滚 掉 。 





















































你 可 以 使 用 PostgreSQL 支持 的 任何 一 种 编程 语言 来 编写 触发 器 函数 ， 但 请 注意 不 能 使 用 
SQL， 因 为 它 不 是 过 程式 语言 。SQL 对 应 的 过 程式 语言 是 PL/pgSQL， 它 也 是 目前 为 止 在 
PostgreSQL 环境 中 使 用 最 广泛 的 语言 。8.3.2 市 会 介绍 相关 的 用 法 。 








8.1.3 聚合 操作 


大 多 数 其 他 数据 库 仅 允许 使 用 ANSI SQL 标准 中 定义 的 那些 聚合 国 数 ， 比 如 MIN、MAX、 
AVG、SUM 以 及 COUNT 等 。 在 PostgreSQL 中 则 无 此 限制 ， 你 可 以 自行 实现 比 以 上 函数 功能 
复杂 的 聚合 函数 。 在 PostgreSQL 中 ， 一 个 聚合 函数 同时 也 可 以 作为 窗口 函数 (相关 概念 请 
参见 7.4 节 ) 来 使 用 ， 因 此 你 可 以 实现 事半功倍 的 效果 。 






































你 可 以 使 用 PostgreSQL 所 支持 的 包括 SQL 语言 在 内 的 几乎 任何 语言 来 编写 聚合 国 数 。 
个 聚合 函数 一 般 是 基于 一 个 或 者 多 个 子 函数 实现 的 。 首 先 至 少 得 有 一 个 状态 转换 函数 ， 该 
函数 会 反复 执行 多 次 以 将 输入 的 多 行 记录 聚合 为 一 个 单独 的 结果 。 你 还 可 以 建 并 用 于 处 型 
初始 状态 和 终结 状态 的 函数 ， 不 过 这 两 个 函数 是 可 选 的 。 前 述 这 几 类 函数 都 是 聚合 函数 的 
子 函数 ， 它 们 可 以 使 用 不 同 的 编程 语言 来 实现 ， 我 们 在 “PostgreSQL 的 聚合 函数 ”(http:// 
www.postgresonline.com/journal/index.php?/plugin/tag/aggregates) 这 篇 博文 中 演示 了 基于 
PL/pgSQL、PL/Python 和 SQL 等 多 种 语言 的 子 国 数 构造 而 成 的 聚合 国 数 实例 。 
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不 管 你 使 用 何 种 编程 语言 来 编写 这 些 子 函数 ， 最 终 将 它们 整合 为 一 个 聚合 函数 的 语法 是 一 
样 的 ， 如 下 所 示 。 

CREATE AGGREGATE my_agg (input data type) ( 

SFUNC=state function name， 

STYPE=state type， 

FINALFUNC=final function name， 

INITCOND=initial state value, SORTOP=sort operator 

); 
SFUNC 状态 切换 函数 (这 个 名 称 不 够 直观 ， 此 处 所 谓 的 “状态 ”是 指 在 聚合 运算 过 程 中 每 
处 理 完 一 条 记录 后 得 到 的 中 间 结 果 ) 是 实现 聚合 运算 的 逻辑 主体 ， 它 会 将 自身 上 一 次 被 调 
用 后 生成 的 计算 结果 作为 本 次 计算 的 输入 ， 同 时 输入 的 还 有 当前 新 一 条 的 待 处 理 记录 ， 这 
样 将 所 有 记录 一 条 条 累积 处 理 完毕 后 ， 就 得 到 了 基于 整个 目标 记录 集 的 “状态 "， 也 就 是 
最 终 的 聚合 结果 。 有 的 情况 下 ，SFUNC 处 理 得 到 的 结果 就 是 聚合 函数 需要 的 最 终结 果 ， 但 
另外 一 些 情况 下 SFUNC 处 理 完 毕 的 结果 还 需要 再 进行 最 终 加 工 才 是 我 们 想 要 的 聚合 结果 ， 
FINALFUNC 就 是 负责 这 个 最 终 加 工 步 又 的 函数 。FINALFUNC 是 可 选 的 ， 由 于 它 的 作用 是 对 
SFUNC 函数 的 输出 结果 做 最 后 加 工 ， 因 此 该 函数 的 输入 一 定 是 SFUNC 函数 的 输出 。INITCOND 
也 是 可 选 的 ， 如 果 设 定 了 该 条 目 ， 那 么 其 值 会 被 作为 SFUNC 函数 的 “状态 ”的 初始 值 。 




























































































最 后 的 SORTOP 也 是 可 选 的 ， 其 值 是 类 似 于 > 或 < 这 样 的 运算 符 ， 它 的 作用 是 为 类 似 MAX、 
MIN 这 样 的 排序 操作 指定 排序 运算 符 。 指 定 了 SORTOP 运算 符 后 ， 规 划 器 会 使 用 索引 来 进行 
MAX、MIN 这 样 的 聚合 运算 ， 由 于 索引 是 有 序 的 ， 所 以 可 以 快速 定位 到 索引 的 头 部 或 者 尾部 
寻找 MAX、MIN 值 ， 这 样 就 不 需要 对 所 有 记录 逐条 进行 大 小 值 判断 ， 整 体 运 算 速 度 就 得 以 极 
大 提升 。 不 过 SORTOP 运算 符 的 使 用 有 一 个 先决 条 件 ， 那 就 是 在 聚合 运算 的 目标 表 上 ， 以 下 
两 条 语句 的 执行 结果 必须 完全 相同 。 


SELECT agg(col) FROM sometable; 


SELECT col FROM sometable ORDER BY col USING sortop LIMIT 1; 





在 PostgreSQL 9.4 版 中 ，CREATE AGGREGATE 语法 得 到 了 强化 ， 新 增 了 对 移动 
窗口 聚合 函数 的 支持 ， 该 特性 对 于 窗口 可 移动 的 窗口 函数 是 很 有 意义 的 。 更 
多 详情 请 参考 9.4 版 官方 手册 中 的 “创建 聚合 国 数 ” 这 一 节 (http:/www. 
postgresql.org/docs/9.4/interactive/sql-createaggregate.html) 的 内 容 。 














一 般 来 说 聚合 国 数 只 针对 一 个 列 进行 聚合 运算 ， 比 如 MAX、MIN、AVG 等 ， 但 事实 上 完全 
可 以 建立 针对 多 个 列 进行 聚合 运算 的 聚合 国 数 。 如 果 你 需要 这 样 的 多 列 聚合 国 数 ， 请 参 
考 “ 如 何 创 建 基于 多 个 列 的 聚合 函数 ”(http://www.postgresonline.com/journal/archives/105- 
How-to-create-multi-column-aggregates.html) 这 篇 博文 来 了 解 具 体 的 实现 方法 。 








前 面 已 经 介绍 过 聚合 函数 是 可 以 使 用 SQL 来 编写 的 。SQL 是 一 种 极其 易 用 的 语言 ， 你 不 
需要 关心 那些 各 式 各 样 的 流程 控制 语句 (因为 SQL 中 不 支持 )， 而 且 你 也 很 有 可 能 对 SQL 
已 经 很 熟悉 ， 因 此 上 手 更 加 简单 。 当 编写 聚合 函数 时 ， 仅 仅 使 用 SQL 就 可 以 实现 很 强大 的 
功能 。 我 们 将 在 8.2.2 节 中 介绍 相关 内 容 。 








8.1.4 受信 和 与 非 受 信 语 言 

PostgreSQL 支持 的 函数 语言 可 按照 信任 级 别 分 为 两 类 : 受信 语言 与 非 受 信 语 言 。 很 多 语言 
(但 并 不 是 所 有 ) 同时 提供 了 受信 与 非 受 信 版 本 。 这 里 所 说 的 “受信 ”是 指 该 语言 不 可 能 
对 数据 库 服务 器 的 底层 操作 系统 造成 任何 破坏 。 














。 受信 语言 
受信 语言 不 具备 直接 访问 数据 库 服务 器 底层 文件 系统 的 权限 ， 因 此 在 该 类 语言 中 不 能 
直接 执行 操作 系统 级 命令 。 任 何 权限 级 别 的 用 户 都 可 以 使 用 受信 语言 创建 国 数 。 包 括 
SQL、PL/pgSQL、PL/Perl 在 内 的 语言 都 是 受信 语言 。 





。 非 受信 语言 
非 受 信 语 言 可 以 直接 与 操作 系统 进行 交互 ， 通 过 该 类 语言 可 以 直接 调用 操作 系统 提供 的 
函数 和 Web 服务 接口 。PostgreSQL 中 只 有 超级 用 户 才 有 权 使 用 非 受信 语言 编写 函数 ， 
但 超级 用 户 有 权 将 基于 非 受信 语言 的 函数 的 执行 权限 授予 普通 用 户 。 一 般 来 说 ， 非 受信 
语言 的 命名 会 以 U 结尾 ， 比 如 PL/PerlU、PL/PythonU 等 。 


8.2 ”使 用 SQL 语言 来 编写 函数 


大 多 数 情况 下 我 们 仅仅 使 用 SQL 语言 来 编写 单个 语句 ， 但 事实 上 它 也 可 以 用 于 编写 函数 。 
在 PostgreSQL 中 ， 用 SQL 编写 国 数 是 一 件 很 简单 的 事情 : 只 需 在 现成 的 SQL 基础 上 加 
上 函数 头 和 函数 尾 就 可 以 了 。 但 编写 简单 同时 也 意味 着 功能 有 限 。SQL 不 是 一 种 过 程式 
语言 ， 因 此 你 就 无 法 用 上 比如 条 件 分 支 判 断 这 种 过 程控 制 语句 。 此 外 还 有 一 个 更 严重 的 限 
制 ， 那 就 是 无 法 运行 根据 传 和 到 函数 中 的 实 参 即时 组 合成 的 动态 SQL 语句 。 
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当然 ，SQL 函数 也 有 其 优点 。 查 询 规划 器 可 以 深入 到 SQL 函数 内 部 并 对 其 中 每 一 条 SQL 
语句 进行 分 析 和 优化 ， 该 过 程 被 称 为 inlining， 即 内 联 处 理 。 规 划 器 对 于 别 的 语言 编写 的 函 
数 只 能 当成 黑 合 处理。 内 联 处 理 机 制 使 得 SQL 函数 能 够 充分 利用 索引 从 而 提高 执行 效率 。 





8.2.1 编写 基本 的 SQL 函数 


示例 8-2 演示 了 一 个 最 基本 的 SQL 函数 ， 该 函数 向 表 中 插入 一 条 记录 ， 并 返回 一 个 标量 值 。 














示例 8-2: 创建 一 个 SQL 函数 ， 其 返回 值 为 新 插入 的 记录 的 唯一 ID 
CREATE OR REPLACE FUNCTION write to log(param user_name varchar, param_description 
text) 
RETURNS integer AS 
$$ 
INSERT INTO logs(user_name, description) VALUES($1, $2) 
RETURNING log_id; 
$$ 
LANGUAGE 'sql' VOLATILE; 


函数 的 调用 语法 如 下 所 示 。 


SELECT write_ to_log('alejandro', 'Woke up at noon.') As new_id; 





类 似 地 ， 也 可 以 在 SQL 函数 中 更 新 数据 并 返回 一 个 标量 或 者 不 返回 ， 如 示例 8-3 所 示 。 
示例 8-3: 创建 一 个 进行 更 新 操作 的 SQL 函数 


CREATE OR REPLACE FUNCTION 
update_logs(log_ id int, param user_name varchar, param description text) 
RETURNS void AS 
$$ 
UPDATE Logs SET user_name = $2, description = $3 
, log_ts = CURRENT_TIMESTAMP WHERE log id = $1; 


$$ 
LANGUAGE 'sql' VOLATILE; 


通过 以 下 语句 来 调用 此 函数 。 


SELECT update_logs(12, 'alejandro', 'Fell back asleep.'); 


在 9.2 版 之 前 ，SQL 函数 仅 可 以 在 函数 主体 中 使 用 输入 实 参 的 序号 位 置 。 从 
9.2 版 开始 支持 使 用 命名 实 参 的 选项 。 比 如 ， 你 可 以 使 用 param_1 和 param_2 
来 代替 之 前 $1 和 $2 这 种 写法 。 除 了 SQL 以 外 的 其 他 语言 在 9.2 版 之 前 无 此 
限制 ， 也 就 是 说 它们 一 直 都 可 以 使 用 实 参 名 来 引用 实 参 。 




















人 言 编写 的 函数 都 支持 返回 结果 集 ，SQL 函数 也 不 例外 ， 它 有 三 种 返回 结 
果 集 的 方法 : 第 一 种 是 ANSI SQL 标准 中 规定 的 RETURNS TABLE 语法 ， 第 二 种 是 使 用 OUT 
形 参 ， a 第 一 种 的 RETURNS TABLE 语法 是 从 PostgreSQL 8.3 版 








150 | 第 8 章 

















才 开始 支持 的 ， 其 他 数据 库 一 般 也 都 是 基于 该 语法 来 实现 结果 集 的 返回 。 在 示例 8-4 中 ， 
我 们 演示 了 如 何 使 用 这 三 种 方法 来 实现 返回 结果 集 。 


示例 8-4: 在 函数 中 返回 结果 集 
使 用 RETURNS TABLE 语法 的 方式 如 下 所 示 。 

















CREATE OR _ REPLACE FUNCTION seLect_Logs_rt(param_user_name varchar) 

RETURNS TABLE (Log_id int, user_name varchar(50), description text, log_ts time 
stamptz) AS 

$$ 

SELECT log_id, user_name, description, log_ts FROM logs WHERE user_name = $1; 
$$ 

LANGUAGE 'sql' STABLE; 


使 用 OUT 形 参 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION select_logs_out(param user_name varchar, OUT log_id int 
，OUT user_name varchar, OUT description text, OUT Log_ts timestamptz) 

RETURNS SETOF record AS 

$$ 

SELECT * FROM Logs WHERE User_name = $1; 

$$ 

LANGUAGE 'sql' STABLE; 


使 用 复合 数据 类 型 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION seLect_Logs_so(param_user_name varchar) 
RETURNS SETOF logs AS 

$$ 

SELECT * FROM logs WHERE user_name = $1; 

$$ 

LANGUAGE 'sql' STABLE; 


以 上 三 种 方式 实现 的 函数 的 调用 方法 都 是 一 样 的 。 


SELECT * FROM select logs xxx('alejandro'); 


8.2.2 ”使 用 SQL 语言 编写 聚合 函数 

本 证 将 演示 如 何 使 用 SQL 语言 来 创建 一 个 用 于 计算 几何 平均 值 的 聚合 函数 。 几 何平 
均值 (http://www.buzzardsbay.org/geomean.htm) 是 指 n 个 正 数 的 连 乘 积 的 n 次 方 根 
((x1*x2*x3...xn)"")， 它 在 金融 、 经 济 以 及 统计 学 领域 有 着 广泛 的 应 用 。 当 样本 数字 的 
值 域 范 围 变化 很 大 时 ， 可 以 使 用 几何 平均 值 来 替代 更 常见 的 算术 平均 数 。 几 何平 均值 可 以 
使 用 更 高 效 的 公式 来 计算 : EXP(SUM(LN(x))/n)， 该 公式 使 用 了 对 数 来 将 连续 的 乘法 运算 转 
换 为 连续 的 加 法 运算 ， 因 此 计算 机 执行 的 效率 更 高 。 在 下 面 的 例子 中 ， 我 们 将 使 用 该 公式 
计算 几何 平均 值 。 


为 了 实现 几何 平均 值 运算 ， 我 们 使 用 了 两 个 子 国 数 : 一 个 状态 转换 函数 ， 用 于 把 对 数 运 算 
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结果 相 加 (参见 示例 8-5) ;一 个 最 终 处 理 函 数 ， 用 于 对 对 数 之 和 进行 取 徊 运算 。 此 外 我 们 
还 需要 指定 状态 初始 值 为 0。 


示例 8-5: 创建 几何 平均 值 聚 合 函 数 的 状态 切换 函数 


CREATE OR _ REPLACE FUNCTION geom_mean_state(prev numeric[2], next numeric) 
RETURNS numeric[2] AS 


CASE 
WHEN $2 IS NULL OR $2 = 9 THEN $1 
ELSE ARRAY[COALESCE($1[1],0) + ln($2), $1[2] + 1] 
END; 
$$ 
LANGUAGE sql IMMUTABLE; 


此 处 定义 的 状态 切换 函数 有 两 个 输入 项 : 第 一 个 是 前 次 调用 本 状态 切换 函数 计算 后 得 到 的 
结果 ， 其 类 型 为 含 两 个 元 素 的 数字 型 数组 ， 第 二 个 是 本 轮 计算 要 处 理 的 样本 值 。 如 果 第 二 
个 实 参 的 值 为 NULL 或 者 为 0， 则 本 轮 无 需 计 算 ， 直 接 返 回 实 参 1 的 值 ， 否 则 将 本 次 处 理 
的 样本 数字 的 In 对 数值 累加 到 实 参 数组 的 第 一 个 元 素 上 ， 并 对 实 参 数组 的 第 二 个 元 素 值 加 
1。 这 样 最 终 得 到 结果 就 是 含 所 有 样本 数字 的 In 对 数值 的 总 和 以 及 总 运算 次 数 。 
















































































此 外 我 们 还 需要 一 个 如 示例 8-6 所 示 的 最 终 处 理 函 数 ， 该 函数 中 需要 将 状态 转换 函数 计算 
得 到 的 两 个 值 相 除 。 


示例 8-6: 创建 几何 平均 值 聚 合 函 数 的 最 终 处 理 函 数 
CREATE OR REPLACE FUNCTION geom mean_final(numeric[2]) 
RETURNS numeric AS 
$$ 
SELECT CASE WHEN $1[2] > © THEN exp($1[1]/$1[2]) ELSE 9 END; 
$$ 
LANGUAGE sql IMMUTABLE; 





最 后 ， 我 们 需要 将 前 面 定 义 的 这 些 子 国 数 整 合 到 一 起 组 成 一 个 完整 的 聚合 国 数 ， 语 法 如 
示例 8-7 所 示 。( 请 注意 ， 本 例 中 的 聚合 运算 需要 一 个 初始 值 (0,0)， 该 初始 值 的 类 型 与 
SFUNC 的 实 参 类 型 一 定 是 一 致 的 。) 











示例 8-7: 基于 定义 好 的 子 国 数 来 创建 儿 何平 均值 聚合 函数 
CREATE AGGREGATE geom_mean(numeric) ( 
SFUNC=geom_mean_state, 
STYPE=numeric[]， 
FINALFUNC=geom_mean_final, 
INITCOND="' {0,0}' 
); 


接 下 来 我 们 测试 一 下 刚刚 创建 好 的 geom_mean 聚合 函数 。 在 示例 8-8 中 ， 我 们 计算 出 了 马 
萨 诸 塞 州 各 县 的 种 族 多 样 性 排名 ， 并 列 出 种 族 多 样 性 最 好 的 5 个 县 的 数据 。 





示例 8-8: 基于 几何 平均 值 来 统计 出 种 族 多 样 性 最 好 的 5 个 县 


SELECT Left(tract_id,5) As county, geom mean(val) As div_county 


FROM census.vw_facts 


WHERE category = 'Population' AND short_name != 'white_alone' 


GROUP BY county 
ORDER BY div_county DESC LIMIT 5; 


county 


| 
二 
25025 | 85.1549046212833364 
| 
| 
| 
| 


25013 79.5972921427888918 
25017 74.7697097102419689 
25021 73.8824162064128504 
25027 73.5955049035237656 


接 下 来 我 们 大 胆 一 点 ， 直 接 将 上 面 定义 的 聚合 
如 示例 8-9 所 示 。 


示例 8-9: 列 出 5 个 种 族 多 样 性 最 好 的 人 口 普查 区 





WITH X AS (SELECT 
tract_id, 
Left(tract id,5) As county, 

















国 数 当 作 窗 口 函 数 来 试 一 下 ， 看 效果 如 何 ， 





geom mean(val) OVER (PARTITION BY tract id) As div tract, 
ROW_NUMBER() OVER (PARTITION BY tract id) As rn， 
geom mean(val) OVER(PARTITION BY left(tract id,5)) As div county 


FROM census.vw_facts WHERE category = 
) 


'Population' AND short_name != 'white_alone’ 


SELECT tract _ id, county, div_ tract, div_county 


FROM X 
WHERE rn = 1 


ORDER BY div_tract DESC，div_county DESC LIMIT 5; 


tract_id div_tract 


25027731900 | 25027 265.6136902148147729 
25021416200 | 25021 261.9351057509603296 
25025130406 | 25025 260.3241378371627137 
25017342500 | 25017 257.4671462282508267 


8.3 ”使 用 PL/pgSQL 语 言 


| | | 
十 十 + 
25025160101 | 25025 | 302.6815688785928786 | 85.1549046212833364 
| | | 
| | | 
| | | 
| | | 


73.5955049035237656 
73.8824162064128504 
85.1549046212833364 
74.7697097102419689 


编写 函数 





如 果 SQL 语言 已 经 不 能 满足 你 编写 函数 的 需求 ， 一 般 来 说 常见 的 解决 方案 是 是 转 为 使 用 PL/ 
pgSQL。 I 优 于 SQL 之 处 在 于 它 支持 通过 DECLARE 语法 定义 本 地 变量 以 及 支持 流 








程控 制 语 ? 





8.3.1 编写 基础 的 PL/pgSQL 函 数 


为 了 向 你 展示 PL/pgSQL 与 SQL 之 间 的 语法 区 





x 别 ， 我 们 在 示例 8-10 中 用 PL/pgSQL 重 写 了 





示例 8-4 中 的 函数 例子 。 
示例 8-10: 使 用 PL/pgSQL 编写 返回 值 为 表 类 型 的 函数 


CREATE FUNCTION select_ logs_rt(param user_name varchar) 
RETURNS TABLE (Log_id int, user_name varchar(50), description text, log_ts time 
stamptz) AS 
$$ 
BEGIN RETURN QUERY 
SELECT log_id, user_name, description, log_ts FROM Logs 
WHERE User_name = param_User_name; 
END; 
$$ 
LANGUAGE 'plpgsql' STABLE; 


8.3.2 ”使 用 PL/pgSQL 编 写 触 发 器 函数 
由 于 PostgreSQL 不 支持 使 用 SQL 编写 触发 器 函数 ， 因 此 PL/pgSQL 就 成 了 编写 触发 器 函 
数 的 首选 。 本 市 中 ， 我 们 将 向 你 介绍 如 何 使 用 PL/pgSQL 编写 基本 的 触发 器 函数 。 


总 共 需 要 两 个 步骤 : 第 一 步 是 写 一 个 触发 器 函数 ， 第 二 步 是 将 此 触发 器 函数 显 式 附加 到 合 
适 的 触发 器 上 。 这 第 二 步 将 处 理 触 发 器 的 函数 与 触发 器 本 身分 离开 ， 这 是 PostgreSQL 的 
一 个 强大 功能 。 你 可 以 将 同一 个 触发 器 函数 附加 到 多 个 触发 器 上 ， 从 而 实现 触发 器 函数 逻 
辑 的 重用 。 该 模式 是 PostgreSQL 的 独创 功能 ， 没 有 任何 别 的 数据 库 能 支持 该 特性 。 由 于 
触发 器 函数 之 间 是 完全 独立 的 ， 因 此 你 可 以 为 每 个 触发 器 函数 选择 不 同 的 编程 语言 ， 这 些 
不 同 语言 编写 的 触发 器 完全 可 以 协同 工作 。PostgreSQL 支持 通过 一 个 触发 事件 (INSERT、 
UPDATE、DELETE) 激活 多 个 触发 器 ， 而 且 每 个 触发 器 可 以 基于 不 同 语言 编号。 例如， 假设 
数据 库 中 发 生 某 一 事件 时 你 需要 将 其 记录 下 来 ， 另 外 还 需要 发 邮件 通知 你 。 那 么 你 可 以 
使 用 PL/PythonU 或 者 PL/PerlU 语言 编写 一 个 具备 发 送 邮件 功能 的 触发 器 ;同时 可 以 使 用 
PL/pgSQL 语言 编写 一 个 记录 日 志 的 触发 器 。 发 生 指 定 事件 时 ， 这 两 个 触发 器 会 同时 被 触 
发 ， 各 自 执行 各 自 的 任务 。 


示例 8-11 中 演示 了 如 何 创建 一 个 基本 的 触发 器 函数 及 配套 的 触发 器 。 
示例 8-11: 通过 触发 器 对 新 插入 的 记录 或 者 修改 的 记录 打 时 间 惟 


CREATE OR REPLACE FUNCTION trig time stamper() RETURNS trigger ASs @ 
$$ 
BEGIN 
NEN.upd_ts := CURRENT_TIMESTAMP; 
RETURN NEW; 
END; 
$$ 
LANGUAGE plpgsql VOLATILE; 




































































CREATE TRIGGER trig 1 

BEFORE INSERT OR UPDATE OF session_state, session id @ 
ON web_sessions 

FOR EACH RON EXECUTE PROCEDURE trig time_ stamper(); 





A 
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@ 定义 触发 器 函数 。 该 函数 适用 于 任何 带 有 upd_ts 字段 的 表 ， 该 国 数 会 先 将 upd_ts 字段 
的 值 更 新 为 当前 时 间 惟 ， 然 后 再 返回 修改 后 的 记录 。 这 种 修改 记录 新 值 的 动作 应 该 放 
在 BEFORE 触发 器 中 ，AFTER 触发 器 被 触发 时 记录 新 值 已 经 写 入 表 中 ， 因 此 时 机 已 经 错 
过 ， 此 时 所 有 对 记录 新 值 的 修改 动作 都 会 被 忽略 。 

@ “字段 级 触发 ”是 9.0 版 开始 支持 的 一 个 特性 ， 通 过 该 特性 可 以 将 触发 器 的 触发 时 机 精 
确 到 字段 级 别 。 在 9.0 版 之 前 ， 只 要 发 生 了 UPDATE 或 者 INSERT 动作 ， 上 面 示例 中 的 触 
发 器 都 会 被 触发 ， 因 此 如 果 要 实现 字段 级 触发 控制 就 必须 拿 0LD.some_column 和 NEW. 
some_column 进行 对 比 ， 找 到 发 生变 化 的 字段 ， 然 后 才能 判定 是 否 要 进行 “字段 级 触 
发 "。( 请 注意 ; INSTEAD OF 触发 器 不 支持 该 特性 。) 


8.4 使 用 PL/Python 语 言 编写 函数 


Python 是 一 种 非常 灵活 的 语言 ， 它 支持 非常 丰富 的 功能 扩展 库 。 据 我 们 所 知 ，PostgreSQL 
是 唯一 一 种 允许 用 户 使 用 Python 语言 来 编写 函数 的 数据 库 。 从 9.0 版 开始 ，PostgreSQL 还 
同时 支持 了 Python 2 和 Python 3 两 种 语言 。 












































你 可 以 在 同一 个 database 中 同时 安装 PL/Python2U 和 PL/Python3U 这 两 个 语 
言 包 ， 但 在 同一 个 用 户 会 话 上 不 能 同时 使 用 这 两 种 语言 。 这 就 意味 着 你 不 能 
在 同一 个 语句 中 同时 调用 分 别 由 PL/Python2U 和 PL/Python3U 编写 的 函数 。 
人 尔 在 系统 中 会 见 到 一 种 叫 作 PL/PythonU 的 语言 ， 它 实际 上 是 系统 为 了 保持 
前 向 兼容 而 为 PL/Python2U 语言 建 的 一 个 别名 。 














在 使 用 PL/Python 语言 之 前 ， 要 先 在 服务 器 上 搭建 好 Python 运行 环境 。Windows 和 Mac 
平台 的 Python 安装 包 可 以 从 http:/www.python.org/download/ 站 点 下 载 到 。Linux/Unix 平台 
的 各 种 发 行 版 上 一 般 都 已 经 附带 了 Python 环境 ， 因 此 无 需 额 外 安装 。 请 参考 PostgreSQL 
官方 手册 中 对 PL/Python 的 相关 介绍 (http://www.postgresql.org/docs/current/interactive/ 
plpython.html) 来 了 解 详情 。 搭 建 好 Python 运行 环境 之 后 ， 需 要 为 PostgreSQL 安装 Python 
语言 扩展 包 。 





CREATE EXTENSION plpython2u; 
CREATE EXTENSION plpython3u; 


在 PostgreSQL 上 安装 Python 语言 扩展 包 之 前 ， 请 务必 确保 服务 器 操作 系统 上 的 Python 运 
行 环境 已 经 正常 ， 否 则 你 可 能 会 遇 到 各 种 奇 奇 怪 怪 的 问题 。 





由 于 PostgreSQL 的 PL/PythonU 语言 扩展 包 是 基于 某 个 有 具体 版 本 的 Python 语言 包 编 译 出 
来 的 ， 因 此 你 需要 保证 服务 器 上 的 Python 版 本 与 pLpythonu 扩展 包 的 版 本 是 匹配 的 。 例 
如 ， 假 设 你 的 plpython2u 扩展 包 是 基于 Python 2.7 版 编译 的 ， 那 么 服务 器 上 就 需要 安装 好 
Python 2.7 运行 环境 。 





编写 基本 的 Python 函数 

PostgreSQL 会 自动 在 PostgreSQL 数据 类 型 与 Python 数据 类 型 间 进行 双向 转换 。PL/Python 
语言 编写 的 函数 支持 返回 数组 和 复合 数据 类 型 。 你 可 以 使 用 PL/Python 来 编写 触发 器 函数 
和 聚合 函数 。 我 们 在 Postgres Online 站 点 上 提供 了 一 系列 介绍 PL/Python 的 文章 (http:// 
www.postgresonline.com/journal/index.php?/plugin/tag/plpython)， 其 中 有 相关 的 语法 示例 。 





























Python 语言 可 以 实现 一 些 通 过 PL/pgSQL 语言 无 法 实现 的 功能 。 在 示例 8-12 中 ， 我 们 演示 
了 如 何 使 用 PL/Python 语言 来 编写 一 个 文本 搜索 函数 ， 该 函数 可 以 实现 对 PostgreSQL 在 线 
官方 手册 的 内 容 进行 检索 。 


示例 8-12: 使 用 PL/Python 语言 编写 的 函数 来 搜索 PostgreSQL 官方 手册 的 内 容 
CREATE OR REPLACE FUNCTION postgresqL_heLp_search(param_search text) 
RETURNS text AS 
$$ 
import urllib, re @ 
response = urllib.urlopen( 
"http://www.postgresqL.org/search/?uU=%2Fdocs%2Fcurrent%2F&q=' + param_search 
) @ 
raw_html = response.read() © 
result = raw_html[raw_html.find("<!-- docbot goes here -->") : raw_html.find("<!-- 
pgContentWrap -->") - 1] @ 
result = re.sub('<[^<]+?>', '', result).strip() © 
return result @ 
$$ 
LANGUAGE plpython2u SECURITY DEFINER STABLE; 








导入 我 们 接 下 来 需要 使 用 的 功能 库 。 
在 连接 搜索 词 之 后 执行 搜索 。 
读 取 返回 的 搜索 结果 并 将 其 保存 到 一 个 名 为 raw_htmt 的 变量 中 。 

从 raw_html 中 将 <!-- docbot goes here --> 和 <!-- pgContentWrap --> 之 间 包 含 的 内 
容 截 取出 来 并 存放 到 一 个 名 为 resutt 的 新 变量 中 。 

@ 将 resutt 开头 部 分 和 结尾 部 分 的 HTML 标记 和 空格 删除 掉 。 


@ 返回 result 变量 的 内 容 。 














© ®@ © e 














调用 Python 函数 与 调用 别 的 语言 编写 的 函数 没什么 两 样 。 在 示例 8-13 中 ， 我 们 使 用 在 示 
例 8-12 中 创建 的 函数 来 搜索 三 个 字符 串 。 


示例 8-13: 在 查询 语句 中 使 用 Python 函数 
SELECT search_term, left(postgresql_help_search(search_term), 125) As result 
FROM (VALUES ('regexp_match'),('pg_trgm'),('tsvector')) As x(search_term); 


前 面 提 到 过 PL/Python 是 一 种 非 受信 语言 ， 而 且 没 有 相应 的 受信 版 本 。 这 意味 着 只 有 超级 
用 户 才能 使 用 PL/Python 编写 函数 ， 并 且 使 用 该 语言 编写 出 来 的 函数 可 以 直接 操作 文件 系 
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统 。 示 例 8-14 就 利用 了 PL/Python 的 这 种 能 力 来 获得 一 个 目录 中 的 文件 列表 。 请 注意 ， 从 
操作 系统 的 角度 来 看 ，PL/Python 函数 是 以 PostgreSQL 安装 时 创建 的 postgres 操作 系统 账 
户 身份 来 执行 的 ， 因 此 你 在 执行 该 示例 之 前 需要 确保 postgres 账户 对 该 示例 中 使 用 的 目录 
拥有 访问 权限 。 

















示例 8-14: 列 出 一 个 目录 中 的 所 有 文件 
CREATE OR REPLACE FUNCTION list incoming files() 
RETURNS SETOF text AS 
$$ 
import os 
return os.listdir('/incoming') 
$$ 
LANGUAGE 'plpython2u' VOLATILE SECURITY DEFINER; 

















可 以 通过 以 下 语句 执行 上 面 创 建 的 函数 。 


SELECT filename 
FROM list_ incoming files() As filename 
WHERE filename ILIKE '%.csv' 


8.5 ”使 用 PL/V8、PL/CoffeeScript 以 及 PL/Live- 
Script 语言 来 编写 函数 


PL/V8 (http:Wcode.google.comy/p/plv8js/wikiPLV8， 又 名 PL/JavaScript) 是 一 种 基于 Google 
V8 (http://code.google.com/p/v8/) 引擎 的 受信 语言 。 通 过 它 可 以 实现 用 JavaScript 来 编写 
函数 并 使 用 JSON 数据 类 型 来 与 外 界 交 互 。PL/V8 并 不 是 PostgreSQL 的 一 个 核心 功能 ， 医 
此 在 比较 流行 的 PostgreSQL 发 行 版 中 一 般 都 不 附带 此 语言 包 ， 只 有 Heroku 是 个 例外 。 你 
可 以 通过 源码 自行 编译 安装 。 我 们 已 经 为 你 提供 了 编译 好 的 Windows 平台 安装 包 ， 适 用 
于 PostgreSQL 9.2 和 9.3 版 。9.2 版 的 下 载 地 址 是 ( 含 32 位 和 64 位 版 本 ) : http:Wwww. 
postgresonline.com/journal/archives/280-PLV8-1.3-windows-binaries-for-PostgreSQL-9.2.html。 
9.3 版 的 下 载 地 址 是 ( 含 32 位 和 64 位 版 本 ) : http://www.postgresonline.com/journal/ 
archives/305-PostgreSQL-9.3-extension-treats-for-windows-users-plV 8.html。, 



































尽管 PostgreSQL 9.1 版 已 经 支持 PL/V8， 但 我 们 还 是 强烈 建议 你 升级 到 9.2 版 ， 因 为 该 版 
本 开始 原生 支持 JSON 数据 类 型 。 


在 PostgreSQL 中 安装 了 PL/V8 扩展 包 后 ， 你 会 发 现 新 增 支 持 的 语言 不 是 一 种 ， 而 是 三 种 ， 
不 过 它们 都 是 JavaScript 的 相关 语言 。 





。 PL/V8 (plv8) 
这 是 最 基本 的 JavaScript 语言 ， 也 是 下 面 两 种 语言 的 基础 。 





PL/CoffeeScript (plcoffee) 

CoffeeScript 是 一 门 简洁 的 、 构 架 于 JavaScript 之 上 的 预 处 理 器 语言 ， 可 以 静态 编译 成 
JavaScript。 其 语法 类 似 于 Python， 也 使 用 了 缩 进 格式 来 表达 代码 段 之 间 的 隶属 关系 ， 
从 而 省 掉 了 烦人 的 大 括号 。 





PL/LiveScript (plls) 

LiveScript 是 CoffeeScript 语言 的 一 个 分 支 ， 其 语法 与 CoffeeScript 类 似 ， 但 拥有 更 多 的 
语法 特性 。“ 从 CoffeeScript 转 到 LiveScript 的 10 个 理由 ”这 篇 文章 (http://livescript. 
net/blog/ten-reasons-to-switch-from-coffeescript.html) 中 认为 LiveScript 是 CoffeeScript 的 
理想 替代 品 。 相 比 CoffeeScript 而 言 ，LiveScript 拥有 更 多 类 似 于 Python、EF# 和 Haskell 
的 特性 。 如 果 你 正在 寻找 一 门 比 PL/Python 占用 内 存 空间 更 小 的 受信 语言 ， 那 么 应 该 试 
试 LiveScript。 




















PL/CoffeeScript 和 PL/LiveScript 语言 都 是 基于 相同 版 本 的 PL/V8 库 编 译 的 ， 因 此 二 者 的 功 
能 本 质 上 与 PL/V8 完全 一 致 。 事 实 上 ， 如 果 这 两 种 语言 你 试用 之 后 觉得 不 合适 ， 那 么 也 可 
以 很 轻易 地 切换 回 PL/V8。 这 三 种 语言 都 是 受信 语言 ， 这 意味 着 它们 无 法 访问 底层 文件 系 
统 ， 但 没有 超级 用 户 权 限 的 用 户 们 可 以 用 它们 来 实现 函数 。 


























示例 8-15 中 是 创建 这 三 个 语言 包 的 命令 。 如 果 你 需要 在 某 个 database 中 使 用 这 些 语 言 ， 那 
么 就 必须 在 其 中 执行 一 遍 这 些 安装 命令 。 这 三 种 语言 可 以 单独 按 需 安装 。 




















示例 8-15: PL/V8 系列 语言 包 的 安装 


CREATE EXTENSION plv8; 
CREATE EXTENSION plcoffee; 
CREATE EXTENSION plls; 


与 PL/pgSQL 语言 相 比 ， 上 述 的 PL/V8 系列 语言 能 够 提供 很 多 关键 的 功能 特性 ， 这 使 得 它 
们 有 着 独特 的 存在 价值 。 这 些 特性 中 的 一 部 分 只 有 PL/R 这 种 高 端 过 程 化 语言 才能 支持 。 








与 SQL 和 PL/pgSQL 相 比 ， 数 学 运算 速度 更 快 。 

创建 窗口 函数 的 能 力 。SQL、PL/pgSQL、PL/Python 均 不 支持 该 能 力 (但 PL/R 和 C 语 
言 是 支持 的 )。 

创建 触发 器 函数 和 聚合 函数 的 能 

支持 语句 预 解析 、 子 事务 、 内 秽 国 数 、 类 以 及 try-catch 异常 处 理 机 制 。 

使 用 eval 函数 动态 执行 JavaScript 代码 的 能 

支持 JSON 数据 类 型 ， 能 对 JSON 对 象 进行 循环 盘 选 处 理 。 

在 D0 命令 的 匿名 代码 块 中 访问 函数 的 能 

PL/V8 和 Node.js (http:/nodejs.org/) 均 使 用 了 谷歌 V8 引擎 ， 此 很 多 适用 于 Node. 
js 的 库 可 以 不 经 修改 就 直接 应 用 于 PL/V8。 这 给 Node.js 的 开发 人 员 以 及 其 他 使 用 
JavaScript 进行 网 络 应 用 开发 的 人 们 带 来 了 很 多 便利 。PostgreSQL 中 有 一 个 名 为 plv8x 
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(https://github.com/clkao/plv8x) 的 扩展 包 ， 该 扩展 包 使 得 使 用 Nodejjs 模块 和 你 构建 的 
模块 在 PL/V8 中 重用 更 加 容易 。 


我 们 的 PostgresOnline 博客 站 点 上 提供 了 一 些 介 绍 PL/V8 用 法 的 例子 。 在 有 的 例子 里 
面 ， 我 们 从 网 上 找 来 了 大 块 的 JavaScript 代码 并 修改 移植 为 PL/V8 语言 ， 详 情 可 参考 “使 
用 PLV8 语 言 来 构造 JSON 查询 器 ”(http://www.postgresonline.com/journal/archives/272- 
Using-PLV8-to-build-JSON-selectors.html) 这 篇 博文 。 前 述 PL/V8 系列 语言 可 完美 地 辅助 
Web 应 用 开发 ， 因 为 大 量 的 客户 端 JavaScript 代码 都 是 可 以 直接 拿 来 重用 的 。 不 过 ， 对 于 
PostgreSQL 来 说 ， 这 几 种 语言 更 为 重要 的 意义 在 于 它们 都 是 全 功能 的 强大 语言 ， 可 用 于 处 
理 数 值 计算 、 数 据 修改 以 及 很 多 其 他 任务 。 


8.5.1 编写 基本 的 函数 

PL/V8 语言 的 主要 优点 之 一 就 是 可 以 在 PL/V8 函数 中 直接 调用 任何 JavaScript 国 数 ， 而 且 
几乎 不 需要 做 修改 。 例 如 ， 网 上 有 很 多 对 电子 邮件 地 址 进行 合法 性 验证 的 JavaScript 函数 ， 
我 们 随便 找 了 一 个 并 将 其 封装 为 PL/V8 函数 ， 如 示例 8-16 所 示 。 


示例 8-16: 使 用 PL/V8 函数 来 验证 电子 邮件 地 址 的 合法 性 
CREATE OR REPLACE FUNCTION 
validate email(email text) returns boolean as 
$$ 
var re = /\S+@\S+\.\S+/; 
return re.test(email); 
$$ LANGUAGE plv8 IMMUTABLE STRICT; 





























上 面 的 例子 中 使 用 了 一 个 JavaScript 正则 表达 式 对 象 来 检查 电子 邮件 地 址 的 合法 性 。 示 
例 8-17 演示 了 如 何 使 用 此 函数 。 











示例 8-17: 调用 PL/V8 语言 编写 的 电子 邮件 地 址 合法 性 校 验 函 数 
SELECT email, validate email(email) AS is_valid 
FROM (VALUES ('alexgomezq@gmail.com') 
,('alexgomezqgmail.com'),('alexgomezq@gmailcom')) AS x (email); 


输出 结果 如 下 : 


aLexgomezqgmaiL .com 


牺 
alexgomezq@gmail.com | 
| 
alexgomezq@gmailcom | 





虽然 可 以 使 用 PL/pgSQL 语言 以 及 PostgreSQL 自己 的 正则 表达 式 功能 来 实现 与 上 面 的 示例 
中 完全 相同 的 验证 功能 ， 但 我 们 刚刚 还 是 光明 正大 地 拿 来 了 一 段 别人 的 成 熟 代码 ， 然 后 疫 
花 任 何 时 间 就 实现 了 预期 的 功能 。 对 开发 人 员 来 说 ， 这 难道 不 是 最 理想 的 人 生 吗 ? 如 果 你 





























是 一 名 Web 开发 人 员 ， 而 且 需 要 在 客户 端 和 数据 库 服 务 器 端 同 时 对 某 份 数据 进行 逻辑 完全 
相同 的 合法 性 验证 ， 那 么 使 用 PL/V8 可 以 使 你 的 工作 事半功倍 ， 只 要 在 客户 端 写 好 逻辑 ， 
然后 复制 粘贴 到 数据 库 端 就 可 以 了 。 











你 可 以 创建 一 张 带 一 个 text 字段 的 表 (该 text 字段 用 于 存储 JavaScript 函数 )， 然 后 将 这 些 
校 验 函数 都 存 入 该 表 ， 然 后 通过 一 些 设置 可 以 实现 PostgreSQL 启动 时 自动 加 载 表 中 存储 
的 这 些 函 数 ， 此 后 在 数据 库 的 任何 PL/V8 函数 中 都 可 以 随便 调用 这 些 函 数 了 。 具 体 的 操 
作 步 又 请 参考 Andrew Dunstan 的 博文 “在 PLV8 中 加 载 JavaScript 模块 ”(http://adpgtech. 
blogspot.com/2013/03/loading-useful-modules-in-plv8.html) 。 能 够 实现 JavaScript 国 数 自动 加 
载 的 关键 在 于 PL/V8 原生 支持 了 eval 函数 ， 通 过 该 函数 可 以 动态 执行 任何 JavaScript 命 
令 ， 因 此 才 得 以 在 启动 阶段 就 对 函数 进行 预 加 载 。 


























我 们 通过 一 个 在 线 语 法 转换 器 (js2coffee.org) 将 示例 8-17 中 的 JavaScript 函数 转换 成 了 基 
于 CoffeeScript 语法 的 函数 ， 如 示例 8-18 所 示 。 


示例 8-18: 使 用 PL/Coffee 语言 编写 的 电子 邮件 地 址 校 验 函 数 
CREATE OR REPLACE FUNCTION 
validate email(email text) returns boolean as 
$$ 
re = /\S+@\S+\.\S+/ 
return re.test email 
$$ 
LANGUAGE plcoffee IMMUTABLE STRICT; 


CoffeeScript 与 JavaScript 之 间 的 语法 差别 并 不 大 ， 主 要 的 变化 是 去 掉 了 小 括号 、 大 括号 和 
分 号 。LiveScript 的 语法 和 CoffeeScript 的 语法 更 是 完全 一 样 ， 唯 一 的 差别 就 是 语言 声明 要 
改 为 LANGUAGE plls。 








8.5.2 ”使 用 PL/V8 来 编写 聚合 函数 
在 示例 8-19 中 ， 我 们 使 用 PL/V8 语言 重 写 了 计算 几何 平均 值 的 聚合 函数 ( 原 例子 请 参考 
8.2.2 节 中 的 示例 8-9)。 





示例 8-19: PL/V8 版 的 几何 平均 值 聚合 国 数 的 状态 切换 国 数 
CREATE OR _ REPLACE FUNCTION geom_mean_state(prev numeric[2], next numeric) 
RETURNS numeric[2] AS 
$$ 
return (next == null || next == 0) ? prev : 
[(prev[0] == null)? 0: prev[0] + Math.log(next), prev[1] + 1]; 
$$ 
LANGUAGE plv8 IMMUTABLE; 


示例 8-20: PL/V8 版 的 几何 平均 值 聚合 国 数 的 最 终 处 理 国 数 
CREATE OR _ REPLACE FUNCTION geom_ mean_final(in_num numeric[2]) 
RETURNS numeric AS 





A 
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$$ 

return in_num[1] > 0 ? Math.exp(in_ num[0]/in_num[1]) : 0; 
SS 
LANGUAGE plv8 IMMUTABLE; 


CREATE AGGREGATE 命令 将 各 子 函 数 整合 成 我 们 想 要 的 聚合 函数 ， 不 管子 函数 采用 什么 语言 
写 ， 此 处 语法 都 是 一 样 的 ， 具体 如 示例 8-21 所 示 。 


EE 





示例 8-21: PL/V8 版 的 几何 平均 值 聚合 国 数 的 最 终 定 义 
CREATE AGGREGATE geom mean(numeric) ( 
SFUNC=geom_mean_state, 
STYPE=numeric[]， 
FINALFUNC=geom_mean_final, 
INITCOND="' {0,0}' 
); 











你 可 以 把 示例 8-9 再 次 运行 一 遍 ， 但 把 其 中 的 geom_mean 函数 换 为 此 处 的 PL/V8 版 本 ， 得 
到 的 结果 与 当初 使 用 SQL 版 本 geom_mean 计算 得 到 的 结果 肯定 是 一 样 的 ， 但 PL/V8 版 本 的 
运算 速度 比 SQL 版 本 要 快 两 到 三 倍 。 对 于 数学 运算 来 说 ， 你 会 发 现在 很 多 情况 下 用 PL/V8 
语言 编写 的 函数 要 比 用 SQL 编写 的 相同 功能 的 函数 要 快 10 到 20 倍 。 





























我 们 在 使 用 数据 库 的 过 程 中 迟早 会 遇 到 语句 性 能 问题 ， 常 见 的 解决 方案 是 优化 SQL 语句 本 
身 的 写法 ， 辅 以 建立 合适 的 索引 以 及 更 新 规划 器 分 析 过 程 中 所 需 的 统计 信息 。 为 了 帮助 用 
户 实现 这 些 优 化 动作 ，PostgreSQL 提供 了 内 置 的 执行 计划 解释 器 ， 通 过 它 可 以 展示 出 一 个 
SQL 语句 的 执行 计划 。 如 果 你 了 解 如 何 编 写 正确 的 SQL 语句 ， 如 何 建立 合适 的 索引 ， 再 
加 上 执行 计划 解释 句 的 帮助 ， 那 么 写 出 优秀 的 SQL 语句 并 充分 利用 硬件 的 最 大 计算 能 力 应 
该 不 是 难事 。 


9.1 通过 EXPLAIN 命 令 查看 语句 执行 计划 

要 定位 语句 的 性 能 问题 ， 最 简单 直接 的 方法 就 是 使 用 EXPLAIN 和 EXPLAIN(ANALYZE) 命令 来 
分 析 其 执行 计划 。PostgreSQL 从 很 早 的 版 本 开始 就 已 经 支持 该 命令 ， 并 且 历 年 来 其 功能 一 
直 在 不 断 地 演进 ， 目 前 已 经 非常 成 熟 ， 可 以 展示 出 一 个 语句 的 执行 计划 方方面面 的 细节 。 
在 演进 过 程 中 ， 该 命令 支持 的 输出 格式 也 越 来 越 丰富 。 从 9.0 版 开始 ， 你 其 至 可 以 将 输出 
转 储 为 XML、JSON 或 者 YAML 格式 。 






















































































对 于 普通 用 户 来 说 ， 该 功能 最 令 人 激动 的 一 次 强化 是 几 年 前 pgAdmin 引入 的 图 形 化 展示 执 
行 计划 的 能 力 。 借 助 于 这 种 能 力 ， 你 只 需 通过 仔细 观察 执行 计划 图 即 可 了 解 语 名 的 瓶颈 点 
在 哪里 ， 哪 些 表 应 该 建 索引 ， 以 及 实际 的 执行 路 径 与 预期 的 执行 路 径 是 否 一 致 。 














9.1.1 EXPLAIN 选 项 
要 执行 非 图 形 化 的 EXPLAIN 分 析 ， 只 需 在 SQL 语句 前 加 上 EXPLAIN 或 者 EXPLAIN(ANALYZE ) ， 
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然后 再 执行 即 可 。 


EXPLAIN 本 身 的 执行 效果 是 输出 执行 计划 而 并 不 执行 SQL 语 名 本身， 加 上 ANALYZE 实 参 之 
后 (就 像 EXPLAIN (ANALYZE)) 的 执行 效果 是 执行 该 SQL 语句 本 身 而 且 会 将 实际 执行 情况 
与 执行 计划 进行 对 比分 析 ， 这 可 以 用 来 评估 执行 计划 的 准确 性 。 











在 EXPLAIN 后 增加 VERBOSE 实 参 将 使 得 输出 的 执行 计划 精确 到 列 级 别 。 还 有 一 个 必须 与 
ANALYZE 实 参 联 用 的 BUFFERS 实 参 ， 其 语法 为 EXPLAIN(ANALYZE,BUFFERS) ， 通 过 它 可 以 显示 
出 执行 计划 过 程 中 重用 缓存 数据 时 的 命中 次 数 ， 这 个 数字 越 大 就 表示 本 次 查询 过 程 中 从 内 
存 缓存 中 获取 的 记录 数 越 多 ， 这 些 数据 是 之 前 的 查询 执行 过 程 中 缓存 下 来 的 ， 缓 存 中 已 有 
的 数据 块 就 不 需要 再 从 磁盘 读 取 了 。 














完整 的 SQL 话 名 执行 计划 解释 语法 是 这 样 的 : EXPLAIN(ANALYZE,VERBOSE,BUFFERS)+ 查询 语 
名 ， 执 行 后 输出 的 结果 包括 执行 时 间 、 列 的 输出 以 及 缓存 命中 次 数 等 。 























要 想 使 用 图 形 化 EXPLAIN， 当 然 必须 得 有 比如 pgAdmin 这 样 的 图 形 化 界面 工具 。 通 过 
pgAdmin 启动 图 形 化 EXPLAIN 之 后 ， 请 照常 编辑 查询 ， 而 不 是 执行 它 ， 然 后 从 下 拉 莱 单 中 
选择 EXPLAIN 或 者 EXPLAIN(ANALYZE)。 有 人 可 能 对 图 形 化 界面 操作 不 履 一 顾 ， 认 为 字符 界 
面 对 他 来 说 已 经 足够 ， 那 么 我 们 只 能 说 : 请 多 保重 。 
































对 于 UPDATE 或 者 INSERT 这 种 DML 语句 来 说 ， 如 果 仅 希望 查看 其 执行 计划 而 不 希望 真正 
执行 ， 可 以 把 这 个 语句 包装 成 一 个 事务 块 ， 即 语句 之 前 加 BEGIN， 之 后 加 ROLLBACK。 





9.1.2 ”运行 示例 以 及 输出 内 容 解释 
我 们 找 个 例子 来 试验 一 下 。 首 先 使 用 EXPLAINCANALYZE) 命令 ，SQL 命令 中 使 用 的 是 前 面 的 
示例 4-1 和 示例 4.2 中 创建 的 表 。 


我 们 想 先 测试 语 名 不 使 用 索引 的 情况 ， 因 此 先 将 表 上 的 主键 删 掉 。 




















ALTER TABLE census .hisp_pop DROP CONSTRAINT IF EXISTS hisp_pop_pkey; 


这 样 该 表 上 的 语句 就 不 会 再 使 用 索引 ， 从 示例 9-1 中 可 以 看 到 此 时 的 执行 计划 为 全 表 扫 描 
策略 。 
示例 9-1: 使 用 EXPLAIN (ANALYZE) 查看 全 表 扫 描 的 执行 计划 


EXPLAIN (ANALYZE) SELECT tract id, hispanic or_latino 
FROM census.hisp_pop 
WHERE tract_id = '25025010103'; 





示例 9-2 是 示例 9-1 的 执行 输出 结果 。 
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示例 9-2: EXPLAIN(ANALYZE) 的 执行 结果 


Seq Scan on hisp_pop 
(cost=0.00..33.48 rows=1 width=16) 
(actual time=0.205..0.339 rows=1 loops=1) 
Filter: ((tract id)::text = '25025010103'::text) 
Rows Removed by Filter: 1477 

Total runtime: 0.360 ms 


几乎 所 有 的 执行 计划 都 会 包含 多 个 步 又 ， 每 一 步 又 又 可 能 会 有 若干 子 步 又。 每 一 步骤 会 
一 个 估算 的 执行 时 间 范 围 ， 看 起 来 像 这 样 : cost=6.00..33.48， 如 示例 9-2 所 示 。 其 中 第 
一 个 数字 0.00 是 估算 的 该 步骤 起 始 执行 时 间 ， 第 二 个 数字 33.84 是 估算 的 该 步骤 总 执行 时 
间 。 起 始 执 行 时 间 点 之 前 会 执行 一 些 后 续 计算 的 准备 动作 ， 而 读 取 数 据 、 索 引 扫 描 、 多 表 
数据 关联 整合 等 动作 都 是 在 起 始 执 行 时 间 点 之 后 发 生 的 。 如 果 执 行 方式 为 全 表 扫 描 ， 那 么 
其 起 始 执行 时 间 点 为 0， 因 为 这 种 场景 下 规划 器 只 是 简单 地 立即 开始 扫描 全 表 数 据 ， 没 有 
什么 预备 动作 。 


请 注意 ， 佑 算 的 执行 时 间 (cost) 的 单位 并 不 是 真实 的 时 间 单位 ， 而 是 取决 于 硬件 环境 以 
及 规划 器 的 执行 时 间 单 位 常数 (seq_page_cost 和 cpu_tuple_cost)。 因 此 ，cost 值 仅 具 有 
相对 意义 ， 可 用 于 比较 同一 台 物 理 服 务 器 上 多 个 执行 计划 之 间 的 效率 。 规 划 器 的 任务 就 是 
要 选择 出 总 体 cost 值 最 低 的 一 个 执行 计划 。 































































































因为 我 们 选择 了 在 示例 9-1 中 包含 ANALYZE 实 参 ， 因 此 规划 器 将 运行 查询 ， 所 以 我 们 可 以 
查看 到 真正 的 执行 时 间 统 计 。 


通过 示例 9-2 中 的 执行 计划 可 以 看 到 规划 器 选择 了 全 表 扫 描 策 略 ， 因 为 没有 任何 索引 可 用 。 
下 面 输出 的 Rows Removed by Filter:1477 是 扫描 过 程 中 排除 掉 的 不 符合 条 件 的 记录 数 。 


在 PostgreSQL 9.4 版 中 ，EXPLAIN 输出 的 执行 计划 中 区 分 了 分 析 执 行 计划 的 时 间 和 真正 
的 执行 时 间 ， 并 将 二 者 分 开 单列 。 执 行 计 划分 析 时 间 就 是 规划 器 分 析出 最 终 执行 计划 所 
消耗 的 时 间 ， 执 行 时 间 是 按照 执行 计划 执行 并 得 到 最 终结 果 所 用 的 时 间 。9.4 版 的 输出 如 
示例 9-3。 





























示例 9-3: 9.4 版 中 EXPLAIN(ANALYZE) 命令 的 输出 结果 


Seq Scan on hisp_pop 
(cost=0.00..33.48 rows=1 width=16) (actual time=0.213..0.346 rows=1 loops=1) 
Filter: ((tract_ id)::text = '25025010103'::text) 
Rows Removed by Filter: 1477 

Planning time: 0.095 ms 

Execution time: 0.381 ms 


我 们 把 主键 重新 建 起 来 : 
ALTER TABLE census.hisp_pop ADD CONSTRAINT hisp_pop_pkey PRIMARY KEY(tract_id); 


再 次 执行 示例 9-1 的 语句 ， 得 到 的 输出 如 示例 9-4 所 示 (基于 PostgreSQL 9.4 版 执行 )。 
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示例 9-4: 利用 了 索引 的 执行 计划 
Index Scan using idx_hisp_pop_tract id _ pat on hisp_pop 
(cost=0.28..8.29 rows=1 width=16) (actual time=0.018..0.019 rows=1 loops=1) 
Index Cond: ((tract id)::text = '25025010103'::text) 
Planning time: 0.110 ms 
Execution time: 0.046 ms 








此 场景 下 规划 器 判定 使 用 索引 会 比 全 表 扫 描 效 率 更 高 ， 因 此 在 执行 计划 中 使 用 了 索引 扫描 
策略 。 估 算 的 执行 时 间 从 33.48 降 为 8.29。 起 始 执 行 时 间 点 也 不 再 是 0， 因为 规划 器 需要 
先 扫 摘 索 引 ， 然 后 才能 把 命中 的 记录 从 磁盘 取出 来 (如 果 所 需 数 据 已 经 存在 于 内 存 缓存 
中 ， 也 有 可 能 是 直接 从 内 存 取 )。 你 也 可 以 看 到 规划 器 不 再 需要 扫描 1477 条 记录 ， 这 极 大 
地 降低 了 执行 成 本 。 


对 于 如 示例 9-5 所 示 的 更 复杂 的 查询 ， 其 执行 计划 中 会 包含 更 多 的 子 步 又 。 最 终 执行 的 步 
又 显示 时 总 是 排 在 最 前 ， 其 中 记录 的 估算 时 间 和 真实 时 间 就 是 其 所 有 子 步 骤 相 应 项 目 之 
和 。 子 步骤 在 显示 时 是 按照 其 层级 向 右 逐 级 缩 进 的 。 



































示例 9-5: 带 GROUP BY 和 SUN 的 语句 的 执行 计划 
EXPLAIN (ANALYZE) 
SELECT Left(tract_id,5) AS county_code, SUM(white_alone) As w 
FROM census .htisp_pop 
WHERE tract id BETWEEN '25025000000' AND '25025999999 
GROUP BY county_code; 











示例 9-6 中 记录 的 是 示例 9-5 中 语句 的 执行 计划 ， 其 中 包含 分 组 和 求 和 操作 。 


示例 9-6: 包含 哈 希 聚合 策略 的 执行 计划 
HashAggregate 
(cost=29.57..32.45 rows=192 width=16) (actual time=0.664..0.664 rows=1 loops=1) 
Group Key: "left"((tract id)::text, 5) 
-> Bitmap Heap Scan on hisp_pop 
(cost=10.25..28.61 rows=192 width=16) (actual time=0.441..0.550 rows=204 





Loops=1) 
Recheck Cond: 
(((tract_ id)::text >= "25025000000' : :text) AND 
((tract_id)::text <= '25025999999' : :text)) 
Heap BLocks: exact=15 
-> Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) (actual time=0.421..0.421 rows=204 
Loops=1) 
Index Cond : 
(((tract_ id)::text >= "25025000000' : :text) AND 
((tract id)::text <= '25025999999' : :text)) 
Planning time: 4.835 ms 
Execution time: 0.732 ms 


示例 9-6 中 所 示 执 行 计划 的 顶层 步骤 是 一 个 哈 希 聚合 操作 。 该 操作 包含 一 个 位 图 表 扫 描 子 
市 点 ， 该 位 图 表 扫 描 子 市 点 又 包含 了 若干 位 图 索引 扫描 子 节 点 。 在 本 例 中 ， 因 为 我 们 是 第 
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卫生 所 以 执行 计划 分 析 时 间 远 远 超 过 了 真正 的 执行 时 间 。 但 PostgreSQL 有 执 
行 计划 缓存 功能 ， 所 以 如 果 我 们 再 次 执行 此 语句 ， 或 者 执行 一 个 可 以 共享 缓存 下 来 的 执行 
计划 的 类 似 语句 ， 那 么 执行 计划 的 分 析 时 间 就 会 大 大 减少 。 





9.1.3 图形 化 展示 执行 计划 


如 果 你 觉得 阅读 纯 文字 形式 的 执行 计划 是 一 件 痛 亩 的 事 ， 那 么 图 9-1 中 演示 的 图 形 化 执行 
计划 会 解除 你 的 烦恼 。 























| 了 


hisp_pop_pkey hisp_pop HashAggregate 


Lj 
Planning time: 0.264 ms 











9-1; 图 形 化 展示 执行 计划 











你 只 需 将 鼠标 放 到 图 标 上 就 能 看 到 每 个 步骤 的 详细 信息 。 在 结束 本 节 之 前 ， 我 们 要 向 你 
介绍 一 个 表格 形式 的 执行 计划 展示 工具 (http://explain.depesz.com/)， 该 工具 由 Hubert 
Lubaczewski 创建 ， 在 此 我 们 向 他 表示 感谢 。 打 开工 具 地 址 ， 然 后 将 文本 格式 的 执行 计划 
复制 过 去 ， 就 可 以 得 到 一 个 格式 化 得 非常 漂亮 的 表格 ， 如 图 9-2 所 示 。 











Did it help? Consider supporting us 
Per node type stats 


Bitmap Heap Scan 1 0.129 ms 19.4% 
Bitmap Index Scan 1 0.421 ms 63.4% 
HashAggregate 1 0.114 ms 17.2 % 


Per table stats 


Table name Total time 
scan type | count | sum of times | % oftable 


hisp_pop 一 0.129 ms 19.4% 
Bitmap Heap Scan 1 0.129ms 100.0% 











9-2; 在 线 执行 计划 分 析 工 具 








在 输出 的 HTML 表格 中 ， 你 可 以 看 到 经 过 格式 重 排 的 带 颜色 分 区 的 执行 计划 表 ， 其 中 会 以 
显眼 的 颜色 高 亮 显示 有 问题 的 部 分 ， 如 图 9-3 所 示 。 表 格 中 的 exclusive 列表 示 当 前 步骤 的 
































操作 所 耗 时 间 ，inclusive 列表 示 当 前 步骤 及 其 所 有 子 步骤 的 操作 所 耗 时 间 。 





# | exclusive | inclusive | rows x loops | node 


0.664 D920 1 1 ~ HashAggregate (cost=29.57..32.45 rows=192 width=16) 
(actual time=0.664..0.664 rows=1 loops=1) 


Group Key: "left"((tract_id):-text, 5) 
204 1 中 Bitmap Heap Scan on hisp_pop 


(cost=10.25..28.61 rows=192 width=16) 
(actual time=0.441..0.550 rows=204 loops=1) 


Recheck Cond: (((tract_id)::text >= '25025000000"--text) AND 
((tract_id):-text <= '2502599999g':text) 
Heap Blocks: exact=15 





204 1 中 Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) 
(actual time=0.421..0.421 rows=204 loops=1) 


Index Cond: (((tract_id):-text >= '25025000000"--text) AND 
((tract_id):-text <= '25025999999"--text)) 











图 9-3: 表格 式 的 执行 计划 分 析 结 果 


尽管 图 9-3 中 HTML 表格 形式 的 执行 计划 提供 的 信息 与 纯 文本 形式 的 执行 计划 其 实 是 一 
模 一 样 的 ， 但 使 用 “彩色 编码 ”和 “分 步骤 操作 时 间 统 计 ” 这 两 个 功能 ， 用 户 可 以 更 轻 
全 地 找 出 实际 执行 耗 时 与 预 估 耗 时 之 间 的 人 和 偏差。 黄色、 褐色 以 及 红色 的 格子 是 需要 特别 
注意 的 。 











Rows x 这 一 栏 表示 预 估 查 询 出 的 记录 数 ，rows 栏 显示 的 是 实际 查 出 的 记录 数 。 上 表 中 显示 
的 就 是 预 估 能 返回 192 行 记录 ， 但 实际 仅 返 回 1 条 。 下 面 的 索引 扫描 步骤 总 共 命 中 了 204 
条 记录 ， 但 其 中 的 203 条 其 实 是 不 符合 条 件 的 伪 命 中 ， 这 些 记 录 在 最 后 的 哈 希 聚合 步骤 中 
复查 时 被 揪 出 来 了 。 估 算 的 记录 数 不 准 一 般 是 因为 表 的 统计 信息 未 及 时 更 新 所 导致 。 在 针 
对 某 表 执 行 耗 时 较 长 的 语句 之 前 先 对 其 进行 一 下 分 析 是 很 有 必要 的 。 


S ¢— AX 一 
9.2 ”搜集 语句 的 执行 统计 信息 
性 能 调 优 的 第 一 步 就 是 要 确定 哪些 语句 是 性 能 瓶颈 。PostgreSQL 提供 了 一 个 名 为 pg_stat_ 
statements 的 性 能 监控 扩展 包 以 帮助 用 户 找 出 耗 时 最 长 的 语句 。 该 扩展 包 能 提供 所 有 执行 
过 的 SQL 语句 的 统计 度量 信息 ， 包 括 哪些 语句 执行 得 最 频繁 以 及 每 个 语句 的 执行 总 耗 时 
等 。 基 于 这 些 信 息 我 们 可 以 知道 应 将 优化 的 重点 放 在 哪里 。 


























大 多 数 PostgreSQL 版 本 都 自 带 pg_stat_statements 扩展 包 ， 但 启动 时 必须 明确 指定 预 加 
载 其 动态 库 ， 这 样 系统 才 会 启动 用 于 搜集 统计 数据 的 后 台 进程 。 设 置 方法 如 下 所 示 。 














(1) 在 postgresql.conf 配置 文件 中 ， 将 shared_preload_libraries = '' 更改 为 shared_ 
preload_libraries = 'pg_stat_statements ' 。 


(2) 在 postgresql.conf 文件 的 自 定义 选项 部 分 ,添加 以 下 几 行 。 
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pg_stat_statements .max = 10000 
pg_stat_statements .track = all 


(3) 重启 postgresql 服务 。 
(4) 登录 到 每 一 个 希望 进行 SQL 语句 性 能 统计 的 database 中 并 执行 以 下 语句 : CREATE 
EXTENSION pg_stat_statements ; 。 








该 扩展 包 提供 了 以 下 两 个 关键 功能 。 














。 一 个 名 为 pg_stat_statements 的 视图 ， 其 中 可 以 查询 到 当前 登录 用 户 在 各 database 中 执 
行 过 的 所 有 SQL 语句 的 统计 信息 。 

。 一 个 名 为 pg_stat_statements_reset 的 函数 ,该 函数 可 以 将 到 目前 为 止 的 语句 执行 统计 
信息 全 部 清空 ， 不 过 只 有 超级 用 户 才 有 权限 执行 此 函数 。 











示例 9-7 中 的 语句 可 以 查 出 postgresql_book 这 个 数据 库 中 最 耗 时 的 5 个 SQL 语句 。 
示例 9-7: 找 出 特定 database 中 最 耗 时 的 语句 


SELECT 
query, calls, total_ time, rows, 
100.0*shared_blks_hit/nullif(shared_blks_hit+shared_blks_read,0) AS hit percent 
FROM pg_stat_statements As s INNER JOIN pg_database As d On d.oid = s.dbid 
WHERE d.datname = 'postgresql_book' 
ORDER BY total_ time DESC LIMIT 5; 


% 之 一 中 全 
9.3 人 工 干 预 规 划 器 生成 执行 计划 的 过 程 
规划 器 生成 执行 计划 的 行为 会 受到 多 方面 因素 的 影响 ， 有 具体 包括 : 是 否 有 合适 的 索引 、 执 
行 成 本 设置 、 执 行 策略 设置 以 及 数据 如 何 分 布 等 。 本 节 中 ， 我 们 将 向 你 介绍 多 种 可 以 对 规 
划 器 施加 人 工 干 预 的 方法 ， 通 过 这 些 方法 可 以 得 到 更 合理 的 执行 计划 。 


























9.3.1 策略 设置 

与 某 些 其 他 数据 库 产 品 不 同 的 是 ，PostgreSQL 查询 规划 器 不 接受 索引 提示 ， 但 你 可 以 
逐个 查询 或 永久 禁用 各 种 策略 设置 (比如 全 表 扫 描 、 位 图 扫描 、 哈 希 聚 合 、 哈 希 关联 等 
都 是 一 种 执行 策略 ， 都 有 相应 的 策略 设置 )， 以 阻止 规划 器 选 出 某 些 效率 较 低 的 执行 策 
略 。PostgreSQL 官方 手册 中 的 “Planner Method Configuration” (规划 器 方法 配置 ) 这 一 节 
(http://www.postgresql.org/docs/current/static/runtime-config-query.html) 中 介绍 了 所 有 规划 
器 优化 设置 。 默 认 情 况 下 ， 所 有 策略 设置 都 已 启用 ， 此 时 规划 器 因为 不 受 什么 约束 所 以 灵 
活性 是 最 大 的 。 如 果 你 已 经 对 要 查询 的 数据 的 特点 预先 有 了 一 定 了 解 ， 那 么 就 可 以 有 针对 
性 地 禁用 某 些 策略 来 优化 语句 的 执行 路 径 。 不 过 请 注意 ， 即 使 你 设置 了 某 种 策略 为 禁用 ， 
也 并 不 意味 着 规划 器 就 一 定 不 会 使 用 该 策略 。 规 划 器 仅 将 这 些 设置 当 作用 户 的 建议 来 对 
待 ， 最 终 的 决定 权 还 是 在 规划 器 。 
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我 们 有 时 候 会 将 enable_nestloop 〈 骨 套 循环 ) 和 enable_seqscan (全 表 扫描 ) 这 两 个 设置 
设 为 “禁用 ”， 因 为 这 两 种 执行 策略 的 效率 是 很 低 的 ， 不 到 万 不 得 已 不 应 使 用 ， 所 以 通过 
禁用 这 两 个 设置 可 以 告诉 规划 器 “不 到 万 不 得 已 不 要 使 用 这 两 种 策略 “。 你 可 以 禁用 这 两 
种 执行 策略 ， 但 规划 器 在 没有 别 的 选择 时 还 是 可 能 会 使 用 的 ， 因 为 无 论 如 何 至 少 应 该 保证 
语句 可 以 正常 执行 。 如 果 你 在 执行 计划 中 看 到 了 全 表 扫 描 和 舱 套 循环 这 两 种 执行 策略 ， 那 
么 我 们 建议 核查 一 下 到 底 是 因为 规划 器 已 经 找 不 到 更 好 的 策略 所 以 不 得 不 用 ， 还 是 规划 器 
选择 了 错误 的 策略 。 鉴 别 这 两 种 情况 的 最 好 办 法 就 是 我 们 前 面 说 过 的 ， 先 禁用 对 应 的 策略 
然后 再 查看 规划 器 是 否 还 在 使 用 这 些 策略 ， 如 有 果 是 ， 就 说 明 是 规划 器 不 得 不 用 ， 如 果 不 
是 ， 则 说 明 规划 器 之 前 选择 了 错误 的 策略 。 








9.3.2 ”你 的 索引 被 用 到 了 吗 

如 果 规 划 器 选择 了 全 表 扫 描 策略 ， 那 就 意味 着 后 续 执行 过 程 中 会 从 头 到 尾 读 取 表 中 的 每 一 
条 记录 。 规 划 器 会 在 以 下 两 种 情况 下 选择 全 表 扫 描 策 略 : 一 种 情况 是 表 上 没有 合适 的 索引 
能 满足 查询 条 件 的 要 求 ， 另 外 一 种 是 规划 器 认为 通过 索引 来 查找 数据 的 成 本 要 高 于 全 表 扫 
描 。 如 采 你 禁用 了 全 表 扫 描 策略 ， 但 规划 器 依然 选择 了 这 么 干 ， 这 就 说 明 表 上 无 索引 或 
者 虽然 有 索引 但 不 适用 此 语句 的 查询 条 件 。 有 两 个 错 是 大 家 经 常会 犯 的 ， 一 个 是 表 上 缺 
少 必 要 的 索引 ， 另 一 个 是 索引 建 得 不 对 而 导致 查询 语句 用 不 上 。 通 过 查询 pg_stat_user_ 
indexes 和 pg_stat_user_tables 这 两 个 视图 可 以 很 方便 地 得 知 你 的 索引 是 否 被 用 上 了 ， 这 
两 个 视图 是 由 pg_stat_statements 扩展 包 提 供 的 ， 关 于 该 扩展 包 ， 我 们 已 经 在 9.2 市 中 介 
绍 过 了 。 











我 们 下 面 通过 若干 例子 来 说 明 。 还 是 使 用 示例 7-18 中 建 过 的 表 ， 我 们 在 该 表 的 数组 列 
fact_subcats 上 建 一 个 GIN 索引 ，GIN 类 型 的 索引 是 为 数 不 多 的 能 够 支持 数组 类 型 的 索 
引 。 语 句 如 下 : 














CREATE INDEX idx_lu_fact_ types ON census.Lu_fact_types USING gin (fact_subcats ) ; 


我 们 接 下 来 执行 一 个 查询 语句 以 验证 所 建 索引 是 否 有 效 ， 查 询 条 件 为 ，fact_subcats 数 
组 列 中 要 包含 “White alone” 和 “Asian alone” 这 两 个 元 素 。 虽 然 全 表 扫描 策略 的 默认 
设置 就 是 “启用 ”"， 但 我 们 还 是 显 式 地 设 定 一 下 以 防 万 一 。 示 例 9-8 显示 了 该 语句 的 执行 
计划 。 


示例 9-8: 允许 规划 器 选择 全 表 扫 描 策 略 
set enable_seqscan = true; 
EXPLAIN (ANALYZE) 
SELECT * 
FROM census.Lu_fact_types 
WHERE fact_subcats && '{White alone, Black alone}'::varchar[]; 


Seq Scan on lu_fact types 
(cost=0.00..2.85 rows=2 width=200) (actual time=0.066..0.076 rows=2 loops=1) 
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Filter: (fact_subcats && '{"White alone","Black alone"}'::character varying[]) Rows 
Removed by Filter: 66 

Planning time: 0.182 ms 

Execution time: 0.108 ms 





请 注意 ， 在 启用 全 表 扫 描 策 略 的 情况 下 ， 规 划 器 忽略 了 索引 而 选用 了 全 表 扫 描 策 略 。 这 可 
能 是 因为 表 的 规模 很 小 或 者 是 因为 索引 不 适用 于 本 语句 中 的 查询 条 件 。 在 示例 9-9 中 ， 我 
们 执行 的 语句 相同 ， 但 通过 禁用 全 表 扫 描 策略 来 强迫 规划 器 使 用 了 索引 。 


示例 9-9: 禁用 全 表 扫 描 策略 ， 强 行 要 求 使 用 索引 


set enable_ seqscan = false; 

EXPLAIN (ANALYZE) 

SELECT.* 

FROM census.Lu_fact_types 

WHERE fact_subcats && '{White alone, Black alone}'::varchar[]; 

















Bitmap Heap Scan on lu_fact_ types (cost=12.02..14.04 rows=2 width=200) (actual 
time=0.058..0.058 rows=2 loops=1) Recheck Cond: (fact subcats && '{"White 
alone","Black alone"}'::character varying[]) Heap Blocks: exact=1 -> Bitmap Index 
Scan on idx_lu_fact_ types 

(cost=0.00..12.02 rows=2 width=0) (actual time=0.048..0.048 rows=2 loops=1) 

Index Cond: (fact subcats && '{"White alone","Black alone"}'::character 

varying[]) 
Planning time: 0.230 ms 
Execution time: 0.119 ms 





通过 该 执行 计划 可 以 看 到 ， 索 引 建 得 疫 问题 ， 是 可 以 使 用 的 ， 但 规划 器 评估 后 认为 使 用 索 
引 的 执行 成 本 要 高 于 使 用 全 表 扫 描 ， 因 此 规划 器 选择 了 使 用 全 表 扫 描 策 略 。 事 实证 明 规 划 
器 的 评估 结果 是 对 的 ， 通 过 上 面 两 个 例子 中 最 后 的 执行 时 间 可 以 看 到 ， 使 用 索引 查询 的 耗 
时 要 略微 多 于 使 用 全 表 扫 描 的 耗 时 。 但 随 着 表 中 的 数据 的 增加 ， 我 们 将 会 看 到 规划 器 优先 
选择 索引 查询 策略 。 




















为 了 与 前 面 的 例子 做 个 对 比 ， 假 设 我 们 需要 执行 如 下 这 样 一 个 查询 : 
SELECT* FROM census.Lu_fact_types WHERE 'White alone' = ANY(fact_subcats); 


我 们 会 看 到 不 管 将 enable_seqscan 设 为 启用 还 是 禁用 ， 规 划 器 总 是 会 选择 执行 全 表 扫 描 ， 
因为 此 时 索引 无 法 满足 查询 条 件 的 需要 。 因 此 ， 建 立 合适 的 索引 并 编写 正确 的 、 能 用 上 索 
引 的 SQL 是 很 重要 的 。 保 证 了 这 些 以 后 ， 后 续 的 工作 就 是 多 试验 几 次 ， 以 确保 生成 的 执行 
计划 是 最 优 的 。 


9.3.3 表 的 统计 信息 

你 可 能 会 认为 规划 器 又 神秘 又 强大 ， 但 无 论 如 何 规划 器 并 不 是 神 ， 它 只 是 遵循 一 套 设 定 好 
的 算法 来 生成 执行 计划 。 关 于 规划 器 算法 的 内 容 细节 已 经 远 远 超出 本 书 的 范畴 ， 在 此 不 做 
讨论 。 虽 然 规划 器 的 算法 严重 依赖 于 表 的 统计 信息 ， 但 规划 器 不 会 在 每 次 生成 执行 计划 之 








Le 
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前 临时 扫描 所 有 的 相关 表 以 获取 其 统计 信息 ， 因 为 如 果 那 么 做 的 话 任何 语句 的 执行 都 将 巨 
慢 无 比 ， 完 全 没有 执行 效率 可 言 ， 因 此 规划 器 会 依赖 预先 搜集 好 的 表 统计 信息 。 











要 想 规 划 器 能 够 做 出 准确 的 决定 ， 及 时 准确 地 更 新 表 统 计 信 息 是 至 关 重要 的 。 如 果 统 计 信 
息 与 实际 情况 相差 太 大 ， 规 划 器 就 很 可 能 会 常常 推导 出 错误 的 执行 计划 ， 最 差 的 情况 就 是 
错误 地 选择 了 全 表 扫 描 策略 。 一 般 来 说 ,平均 一 张 表 只 有 20% 的 记录 采样 率 ， 统 计 信息 会 
基于 这 些 参 与 采样 的 记录 来 生成 。 对 于 非常 大 的 表 来 说 ， 采 样 率 可 能 更 低 。 你 可 以 通过 设 
置 STATISTICS 值 来 修改 在 每 一 列 上 采样 的 行 数 。 























通过 查询 pg_stats 表 可 以 了 解 当前 的 统计 信息 是 什么 样 的 ， 查 询 结果 如 示例 9-10 所 示 。 


SELECT 
attname As colname, 
n_distinct, 
most_common_vals AS common_vals, 
most_common_freqs As dist freq 
FROM pg_stats 
WHERE tablename = 'facts' 
ORDER BY schemaname, tablename, attname; 


示例 9-10: 数据 分 布 直方 图 





colname | n_distinct | common_vals | dist_ freq 

------------- +------------+------------------+-------------- 

fact_type id | 68 | {135,113... | {0.0157,0.0156333,... 

perc | 985 | {0.00,... | {0.1845,0.0579333,0.056... 
tract_id | 1478 | {25025090300... | {0.00116667,0.00106667,0.0... 
val | 3391 | {0.000,1.000,2...| {0.2116,0.0681333,0... 

yr | 2 | {2011,2010} | {0.748933,0.251067} 





pg_stats 表 给 出 了 表 中 指定 列 的 值 域 分 布 图 ， 规 划 器 会 根据 此 信息 制定 相应 的 执行 计划 。 
系统 后 台 会 有 一 个 进程 持续 不 断 地 更 新 pg_stats 表 。 当 表 中 插入 或 者 删除 大 量 数据 后 ， 你 
应 该 手动 执行 VACUUM ANALYZE 来 更 新 表 的 统计 信息 。VACCUM 指示 将 已 删除 的 记录 永久 性 地 
从 表 中 移 除 ，ANALYZE 指示 更 新 表 的 统计 信息 。 


对 于 经 常 参与 关联 查询 并 且 在 WHERE 子 句 频繁 使 用 的 列 ， 应 该 考虑 提升 采样 的 行 数 。 所 需 
执行 的 代码 如 下 : 






































ALTER TABLE census.facts ALTER COLUMN fact_type_id SET STATISTICS 1000; 


9.3.4 磁盘 页 的 随机 访问 成 本 以 及 磁盘 驱动 器 的 性 能 

另 一 个 会 影响 规划 器 执行 策略 选择 的 设置 是 randon_page_cost (随机 页 访问 成 本 比 ， 简 称 
RPC) 比率 ， 它 表示 在 磁盘 上 顺序 读 取 和 随机 读 取 同 一 条 记录 的 性 能 之 比 。 一 般 来 说 ， 物 
理 磁 盘 速 度 越 快 〈 一 般 也 会 越 贵 ) ， 该 比率 就 会 越 小 。RPC 的 默认 值 是 4， 该 值 适用 于 目前 
市 面 上 的 大 多 数 机 械 硬盘 。 但 如 果 使 用 的 是 固态 硬盘 或 者 SAN 存储 系统 ， 有 必要 对 此 值 
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进行 调整 。 

你 可 以 在 database、 服 务 器 、 表 空间 这 三 个 级 别 设置 RPC 比率 。 如 果 要 在 服务 器 级 别 设置 
该 比率 ， 请 直接 在 postgresql.conf 文件 中 设置 即 可 。 如 果 同 一 台数 据 库 服 务 器 上 使 用 了 不 
同类 型 的 硬盘 ， 并 且 不 同 的 表 空间 落 在 不 同 的 硬盘 上 ， 那 么 可 以 在 表 空间 级 别 设置 RPC 比 
率 ， 语 法 如 下 所 示 。 




















ALTER TABLESPACE pg default SET (random page_cost=2); 


有 关 该 设置 的 详细 信息 ， 请 参考 “关于 随机 页 访问 成 本 比 的 回顾 ”这 篇 博文 (http://www. 
databasesoup.com/2012/05/random-page-cost-revisited.html) 。 这 篇 文章 建议 采用 以 下 设置 。 


。 高 端 NAS/SAN 存储 : 2.5 或 者 3.0 

。 亚 马 还 EBS 和 Heroku 云 平 台 : 2.0 

。 iSCSI 和 其 他 普通 SAN 存储 : 6.0， 但 可 能 变化 比较 大 ， 需 要 按照 实际 情况 设 定 
。 固态 硬盘 : 2.0 至 2.5 

。 NvRAM (也 叫 NAND) : 1.5 


9.4 数据 缓存 机 制 
如 果 你 之 前 执行 过 一 个 复杂 且 耗 时 较 长 的 查询 ， 那 么 后 续 再 次 执行 此 查询 时 会 发 现 快 了 很 
多 ， 这 是 因为 系统 的 数据 缓存 机 制 发 挥 了 作用 。 如 果 同 一 个 查询 语句 按 顺 序 多 次 执行 ， 而 
且 这 些 查询 涉及 的 底层 数据 并 疫 有 发 生变 化 ， 那 么 不 管 这 些 语 句 是 被 同一 个 用 户 还 是 多 个 
用 户 执行 ， 最 终 得 到 的 结果 都 应 该 是 一 样 的 。 只 要 内 存 中 还 有 空间 可 用 于 缓存 数据 ， 那 么 
规划 器 就 可 能 会 跳 过 生成 执行 计划 和 从 磁盘 读 取 表 数据 的 步骤 ， 直 接 从 缓存 中 获取 数据 。 
如 果 语 句 中 使 用 了 CTE 表达 式 和 结果 不 变 式 函 数 ( 这 类 函数 的 运算 结果 不 依赖 外 部 数据 ， 
仅 依赖 输入 的 数据 ， 也 就 是 说 固定 的 输入 一 定 能 得 到 固定 的 输出 )， 那 么 系统 会 更 加 倾向 
于 进行 结果 集 缓存 。 


那么 如 何 查 看 系统 中 缓存 了 那些 数据 呢 ? 如 果 你 的 PostgreSQL 服务 器 是 9.1 版 或 者 更 新 的 
版 本 ， 可 以 通过 安装 pg_buffercache 扩展 包 来 查看 。 先 安装 该 扩展 包 。 





















































CREATE EXTENSION pg_buffercache 








安装 完毕 后 ， 你 可 以 查询 pg_buffercache 视图 ， 如 示例 9-11 所 示 。 


示例 9-11: 查看 表 数 据 是 否 已 被 缓存 
SELECT 
C.relname, 
COUNT(CASE WHEN B.isdirty THEN 1 ELSE NULL END) As dirty_buffers, 
COUNT(*) As num_buffers 
FROM 
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pg_class AS C INNER JOIN 

pg_buffercache B ON C.relfilenode = B.relfilenode INNER JOIN 

pg_database D ON B.reLdatabase = D.oid AND D.datname = current_database() 
WHERE C.reLname IN ('facts'，'Lu_ fact_types ' ) 
GROUP BY C.relname; 





示例 9-11 中 的 语句 查 出 了 facts 和 Lu_fact_types 这 两 张 表 中 被 缓存 的 页 数 。 需 要 先 实际 
执行 一 个 SQL 查询 语句 ， 才 会 有 数据 被 真正 缓存 下 来 ， 此 后 示例 9-11 中 的 语句 才能 有 结 
果 。 我 们 先 执行 一 下 下 面 这 个 语句 。 

SELECT T.fact_subcats[2], COUNT(*) As num_fact 

FROM census .facts As F INNER JOIN census.Lu_fact_types AS T ON F.fact type id = 


T.fact_type_id 
GROUP BY T.fact_subcats[2]; 


当 再 次 执行 上 述 语句 时 ， 你 应 该 可 以 看 到 至 少 10% 的 性 能 提升 ， 并 且 示 例 9-11 的 查询 可 
以 看 到 类 似 以 下 的 结果 。 




















relname | dirty_buffers | num_buffers 
Ey Vp en la 
facts | 0 | 736 
lu_fact_ types | 9 | 4 














用 于 缓存 数据 的 内 存 大 小 是 可 指定 的 ， 该 值 越 大 ， 能 缓存 的 数据 就 越 多 。postgresql.conf 中 
的 shared_buffers 就 是 用 于 设置 此 值 的 ， 但 不 应 设 得 过 大 ， 否 则 会 耗费 过 多 时 间 去 扫描 组 
存 ， 反 而 降低 了 性 能 。 


由 于 如 今 的 物理 内 存 已 经 极其 廉价 ， 因 此 一 般 不 会 再 出 现 内 存 不 够 的 情况 。 基 于 这 一 点 ， 
我 们 很 容易 就 想到 了 可 以 将 一 些 常 用 的 表 预 先 缓存 到 内 存 中 ， 这 样 就 可 以 提高 后 续 访 问 效 
率 。 有 一 个 名 为 pg_prewarm 的 扩展 包 可 以 用 于 实现 此 功能 ， 该 扩展 包 从 PostgreSQL 9.4 版 
开始 成 为 系统 自 带 的 扩展 包 。pg_prewarm 会 将 指定 的 常用 表 预 加 载 到 缓存 中 ， 此 后 不 管 该 
表 是 首次 被 用 户 访问 还 是 非 首次 访问 ， 响 应 速度 总 是 很 快 。 关 于 此 特性 有 一 篇 很 好 的 文章 
可 供 你 参考 :“ 关 系 型 数据 的 预 热 机 制 ”(http:/www.depesz.com/2014/01/10/waiting-for-9-4- 


pg_prewarm-a-contrib-module-for-prewarming-relationd-data/) 。 


9.5 ”编写 更 好 的 SQL 语 句 


最 好 也 最 简单 的 性 能 调 优 方法 就 是 学 会 编写 优秀 的 SQL 语句 。 我 们 在 大 多 数 客户 的 项 目 中 
见 过 的 SQL 语句 都 写 得 不 够 好 ， 它 们 未 能 发 挥 出 PostgreSQL 的 真正 威力 。 









































写 出 的 SQL 语句 很 糟 料 一 般 有 两 大 主要 原因 。 第 一 个 原因 是 很 多 人 会 宦 目 地 复 用 以 前 的 
SQL 编写 经 验 。 例 如 有 人 曾经 写 过 一 个 使 用 了 左 连接 的 SQL 语句 并 且 执 行 效果 还 不 错 ， 
那么 他 此 后 不 管 实际 情况 是 什么 样 都 一 直 使 用 左 连接 语法 ， 但 实际 上 ， 在 有 更 多 表 参 与 关 
联运 算 的 情况 下 ， 最 好 是 使 用 内 连接 。 与 其 他 很 多 编程 语言 不 一 样 ，SQL 语言 的 编写 经 验 
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不 能 寞 目地 复 用 。 


第 二 个 原因 是 人 们 对 于 最 新 的 SQL 语法 特性 一 般 无 法 及 时 跟 进 并 学 习 了 解 。 如 果 用 户 不 及 
时 更 新 自己 的 知识 ， 在 新 版 本 的 PostgreSQL 上 还 基于 旧版 本 的 语法 编写 SQL， 那么 新 版 
本 中 引入 的 那些 可 以 提升 性 能 、 简 化 开发 的 语法 特性 对 他 来 说 就 毫 无 意义 。 


要 想 能 够 编写 出 高 效 的 SQL 是 需要 很 多 练习 的 。 只 要 你 编写 的 SQL 语句 能 得 到 正确 结 
果 ， 那 么 这 个 语句 就 不 能 算 错 ， 但 其 性 能 可 能 很 差 。 本 节 中 我 们 将 指出 人 们 常 犯 的 一 些 
错误 。 尽 管 本 书 是 关于 PostgreSQL 的 ， 但 我 们 给 出 的 这 些 建议 其 实 也 适用 于 其 他 的 关系 
型 数据 库 。 


ZI 





























9.5.1 ”在 SELECT 语 名 中 混用 子 查询 

新 手 们 常 犯 的 一 个 典型 错误 就 是 容易 将 子 查 询 当 成 一 个 完全 独立 的 数据 集 来 使 用 。SQL 语 
言 有 一 个 与 传统 的 编程 语言 很 不 一 样 的 地 方 ， 就 是 SQL 语言 中 并 没有 很 强烈 的 “ 黑 盒 ” 概 
念 。 也 就 是 说 ， 编 写 一 堆 互 相 独 立 的 子 查询 并 把 每 个 子 查询 当 作 一 个 “ 黑 盒 ”数据 块 来 看 
待 ， 只 要 能 得 到 最 后 结果 就 行 ， 而 不 管 其 他 ， 这 种 思路 是 错误 的 。 它 事实 上 割裂 了 子 查询 
代码 块 内 部 处 理 逻 辑 与 子 查询 代码 块 外 部 处 理 逻 辑 之 间 的 联系 ， 没 有 将 整个 SQL 语句 当成 
一 个 有 机 的 整体 来 处 理 。 从 多 个 子 查 询 中 取 数 据 与 从 多 个 表 或 者 视图 中 取 数 据 是 一 样 重要 
的 ， 代 码 写 得 不 好 效率 就 会 很 低 。 


示例 9-12 中 演示 了 一 个 滥用 子 查 询 的 例子 ， 把 子 查询 当 黑 盒 使 用 的 思想 就 会 导致 这 种 写法 。 


示例 9-12: 滥用 子 查询 
SELECT tract_id, 
(SELECT COUNT(*) FROM census.facts As F WHERE F.tract id = T.tract_id) As 
num_facts, 
(SELECT COUNT(*) 
FROM census.luyu fact types As Y 
WHERE Y.fact type_ id IN ( 
SELECT fact_ type_id 
FROM census.facts F 
WHERE F.tract id = T.tract id 
) 
) As num_fact_types 
FROM census.Lu_tracts As T; 







































































上 面 的 SQL 语句 如 果 改 为 示例 9-13 的 写法 效率 会 更 高 。 下 面 的 写法 合并 了 多 个 SELECT 
动作 并 使 用 了 关联 查询 机 制 ， 不 但 比 上 面 的 语句 更 简短 ， 速 度 也 更 快 。 如 果 表 的 数据 量 很 
大 或 者 硬件 性 能 较 差 ， 这 两 种 写法 之 间 的 性 能 差异 会 更 明显 。 


示例 9-13: 针对 滥用 子 查 询 的 语句 的 简化 改写 
SELECT T.tract_id, 
COUNT(f.fact_type_id) As num_facts, 
COUNT(DISTINCT fact_type_id) As num_fact_types 






































174 | 第 9 章 


FROM census.Lu_tracts As T LEFT JOIN census.facts As F ON T.tract id = F.tract_id 
GROUP BY T.tract id; 








图 9-4 显示 的 是 示例 9-12 中 的 语句 的 执行 计划 ， 为 了 帮 你 免除 查看 字符 型 执行 计划 的 痛 
苦 ， 我 们 选择 了 以 图 形 化 方式 展示 。 图 9-5 使 用 http://explain.depesz.com 站 点 提供 的 工具 
将 其 执行 计划 转换 为 以 HTML 表格 方式 呈现 ， 也 可 以 提高 你 的 查看 效率 。 
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图 9-4 : 滥用 子 查询 的 SQL 语句 的 执行 计划 图 形 化 展示 





HTML 
exclusive | inclusive | rows x | rows | loops | node 


10.709 WA ki 11.0 1478 1 = Seq Scan on lu_tractst 
(cost=0.00..615535.37 rows=1478 width=12) (actual timt 


SubPlan (forSeq Scan) 









63.554 264.562 11.0 1 1478 中 Aggregate (cost=207.86..207.87 rows=1 width=0) (ak 
153.712 201.008 11.0 68 1478 中 Bitmap Heap Scan on facts f 
(cost=4.79..207.69 rows=68 width=0) (actual time 
Recheck Cond: ((tract_id):-text = (t.tract_id)::text) 


47.296 47.296 11.0 68 1478 中 Bitmap Index Scan on fki facts_lu_tracts 
(cost=0.00..4.78 rows=68 width=0) (actual tim 


Index Cond: ((tract_id):-text = (ttract idj::text) 





59.120 国有 [LE 11.0 1 1478 中 Aggregate (cost=208.56..208.57 rows=1 width=0) (ak 
314.814 957.744 ff 68 1478 中 Nested Loop 
(cost=207.86..208.39 rows=68 width=0) (actual ti 
155.190 341.418 168.0 68 1478 中 HashAggregate 
(cost=207.86..207.87 rows=1 width=4) (actua 
141.888 186.228 11.0 68 1478 中 Bitmap Heap Scan on facts f 


(cost=4.79..207.69 rows=68 width=4) (actl 
Recheck Cond: ((tract_id):-text = (ttract 


44.340 44.340 11.0 68 1478 只 Bitmap Index Scan on fki_facts_lu_tra¢ 
(cost=0.00..4.78 rows=68 width=0) (ac 


Index Cond: ((tract id)::text = (ttract h 


301.512 301.512 11.0 1 100504 中 Index Scan using pk_lu_fact types on lu_fact 
(cost=0.00..0.50 rows=1 width=4) (actual time 


Index Cond: (fact_type_id = ffact_type_id) 





«| 山 | 











图 9-5 : 滥用 子 查询 的 SQL 语句 的 执行 计划 表格 式 展示 
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图 9-6 显示 的 是 示例 9-13 中 的 简化 后 语句 的 执行 计划 ， 从 图 中 可 以 看 到 简化 了 多 少 执行 
步骤 。 





Um 之 


Merge Left Join GroupAggregate 














fi_facts_lu_tracts 








图 9-6 : 删除 多 余子 查询 后 的 执行 计划 图 形 化 展示 


请 注意 我 们 并 疫 有 要 求 你 完全 不 用 子 查询 ， 我 们 只 是 建议 你 在 确 有 必要 时 才 使 用 ， 并 且 使 
用 时 应 当 注 意 考 虑 如 何 将 子 查 询 与 SQL 语句 的 主干 进行 融合 ， 也 许 你 会 发 现 根本 不 需要 通 
过 子 查询 来 实现 你 所 需要 的 功能 。 总 之 请 牢记 : 子 查 询 不 是 独立 的 黑 盒 数 据 块 ， 应 与 主语 
句 通盘 考虑 后 再 结合 使 用 。 


























9.5.2 ”尽量 避免 使 用 SELECT * 语 法 
SELECT * 经 常会 导致 性 能 浪费 ， 会 出 现 仅仅 需要 10 页 数据 却 查 出 1000 页 数据 这 种 情况 ， 
这 显然 会 导致 网 络 传输 负担 加 大 ， 而 且 还 会 出 现 两 个 你 可 能 意 想不到 的 问题 : 





第 一 个 问题 与 大 对 象 有 关 。PostgreSQL 会 使 用 TOAST (全 称 The Oversized-Attribute 
Storage Technique， 即 超大 尺寸 属性 存储 技术 ) 机 制 来 存储 二 进 制 大 对 象 以 及 超大 文本 。 
TOAST 机 制 会 将 超过 主 表 存 储 限 制 的 数据 存储 到 一 张 辅助 表 中 。 因 此 ， 读 取 超 大 字段 就 
是 一 个 多 表 关 联 操 作 ， 而 这 必定 是 个 耗 时 的 过 程 。 举 个 例子 ， 如 果 某 表 包 含 文本 数据 ， 其 
中 存储 了 一 整 部 的 《战争 与 和 平 》 这 么 庞大 的 内 容 ， 然 后 你 对 这 个 表 做 了 一 个 SELECT * 操 
作 ， 那 么 不 难 想象 这 个 操作 会 慢 到 什么 程度 。 


第 二 个 问题 与 视图 有 关 。 我 们 定义 视图 的 时 候 一 般 疫 办 法 做 到 完全 精确 地 指定 列 ， 也 就 是 
说 视图 中 一 般 都 会 带 车 干 可 能 不 需要 的 列 。PostgreSQL 的 视图 定义 功能 是 很 强大 的 ， 你 可 
以 使 用 SELECT * 语句 来 定义 视图 ， 系 统 会 自动 将 星 号 替换 为 目的 表 的 完整 字段 列表 ， 你 
也 可 以 在 视图 定义 语句 中 包含 复杂 运算 表达 式 以 及 关联 查询 。 这 些 建 视图 的 语句 都 是 合法 
的 ， 没 有 任何 问题 ,但 用 户 访问 时 就 麻烦 了 ， 一 旦 对 这 种 复杂 视图 执行 SELECT * 查询 ， 那 
么 视图 定义 中 所 有 的 复杂 列 都 会 经 历 滥 长 的 运算 过 程 ， 总 体 查 询 速度 会 很 慢 。 


为 了 解释 清楚 以 上 观点 ， 下 面 我 们 会 在 示例 9-12 中 建 一 个 带 复 杂 子 查询 的 SQL 语句 为 基 
础 的 视图 ， 使 用 的 基 表 是 census 中 的 表 : 







































































CREATE OR _ REPLACE VIEWN vw_stats AS 
SELECT tract id， 
(SELECT COUNT(*) FROM census .facts As F WHERE F.tract_id = T.tract_id) As 
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num_facts ， 
(SELECT COUNT(*) 
FROM census.Lu_fact_types As Y 
WHERE Y.fact_type_id IN ( 
SELECT fact_type_id 
FROM census .facts F 
WHERE F.tract id = T.tract id 


) 
) As num_fact_types 
FROM census.lu_tracts As T; 


如 果 我 们 针对 此 视图 执行 以 下 语句 : 

SELECT tract_id FROM vw_stats; 
在 我 们 的 测试 环境 上 该 语句 执行 耗 时 大 约 是 21 毫秒 ， 速 度 很 快 ， 因 为 该 语句 没有 访问 
num_facts 和 num_fact_type 这 两 个 视图 字段 ， 这 两 个 字段 需要 经 过 复杂 的 运算 才能 得 到 结 
果 。 你 查看 一 下 该 语句 的 执行 结果 就 可 以 发 现 其 中 没有 任何 一 个 步骤 会 访问 facts 表 ， 因 
为 规划 器 分 析 该 语句 后 知道 根本 不 需要 访问 此 表 。 但 如 果 我 们 使 用 下 面 的 语句 来 访问 上 述 
视图 : 



































SELECT * FROM vw_stats; 


在 我 们 的 环境 上 执行 时 间 磷 升 到 681 写 秒 ， 其 执行 计划 如 图 9-4 所 示 。 这 里 前 后 两 个 语句 
的 性 能 差别 是 毫秒 级 ， 但 如 果 表 的 记录 数 增加 到 千 万 级 ， 列 数 增加 到 数 百 个 ， 那 么 前 后 两 
个 语句 的 性 能 差异 就 非常 翁 怖 了 。 按 照 前 一 种 写法 ， 查 询 可 以 很 快 完成 ， 你 可 以 搞定 后 准 
点 下 班 ， 按 照 后 一 种 写法 ， 你 就 得 呆 在 办 公 室 加 班 来 等 这 个 查询 执行 完毕 。 











9.5.3 ” 善 用 CASE 语 法 


CASE 是 ANSI SQL 标准 语法 ， 其 功能 其 实 是 很 强大 的 ， 但 我 们 很 少见 到 过 有 人 能 好 好 利用 
它 ， 其 实 我 们 对 这 一 点 也 感到 很 惊讶 。 在 很 多 需要 聚合 运算 的 场景 中 ， 使 用 CASE 语法 能 够 
有 效 殖 代 子 查询 。 接 下 来 我 们 使 用 两 个 例子 来 演示 这 一 点 ， 一 个 使 用 CASE， 一 个 使 用 子 查 
询 ， 然 后 我 们 会 比较 二 者 的 执行 计划 和 性 能 差异 。 示 例 9-14 使 用 了 子 查询 语法 。 


示例 9-14: 使 用 子 查 询 而 非 CASE 


SELECT T.tract_id, COUNT(*) As tot，type_1.tot AS type_1 
FROM 
Census.Lu_tracts AS T LEFT JOIN 
(SELECT tract_id, COUNT(*) As tot 
FROM census .facts 
WHERE fact_type_id = 131 
GROUP BY tract_id 
) As type_1 ON T.tract id = type_1.tract id LEFT JOIN 
census.facts AS F ON T.tract id = F.tract_id 
GROUP BY T.tract_id, type_1.tot; 
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图 9-7 是 示例 9-14 的 执行 计划 图 示 。 
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9-7; 使 用 子 查 询 而 非 CASE 的 执行 计划 


然后 我 们 使 用 CASE 语法 改写 这 个 查询 。 你 会 发 现 优 化 后 的 查询 效率 更 高 也 更 容易 理解 ， 如 
示例 9-15 所 示 。 


示例 9-15: 使 用 CASE 语法 禁 代 子 查询 
SELECT T.tract_id, COUNT(*) As tot, 
COUNT(CASE WHEN F.fact_type_id = 131 THEN 1 ELSE NULL END) AS type_1 
FROM census.Lu_tracts AS T LEFT JOIN census.facts AS F 
ON T.tract_id = F.tract_id 
GROUP BY T.tract_ id; 








图 9-8 是 示例 9-15 中 的 语句 的 执行 计划 区 
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9-8: 使 用 CASE 代替 子 查询 后 的 执行 计划 

尽管 优化 后 的 语句 依然 没 用 上 fact_type 索引 ， 但 其 执行 效率 还 是 提升 了 ， 因 为 规划 器 仅 
对 facts 表 做 了 一 次 扫描 。 一 般 来 疝 ， 执 行 计划 越 短 小 ， 其 执行 过 程 就 越 容易 理解 ， 执 行 
效率 也 越 高 ， 不 过 这 并 不 是 绝对 的 。 


























9.5.4 ”使 用 Filter 语 法 替代 CASE 语 法 

PostgreSQL 9.4 版 中 引入 了 新 的 FILTER 关键 字 ， 我 们 在 7.3 节 中 介绍 过 其 用 法 。 在 使 用 了 
CASE 的 聚合 函数 中 总 是 可 以 用 FILTER 来 代 赫 CASE 的 ， 替 换 以 后 不 但 语法 上 看 起 来 更 整洁 
而 且 执行 效率 也 会 有 所 提高 。 在 示例 9-16 中 ， 我 们 使 用 FILTER 对 示例 9-15 的 语句 进行 了 
改写 。 














示例 9-16: 使 用 FILTER 语法 来 替代 子 查询 
SELECT T.tract_id, COUNT(*) As tot， 
COUNT(*) FILTER(WHERE F.fact_type_id = 131) AS type_1 
FROM census.Lu_tracts AS T LEFT JOIN census.facts AS F 
ON T.tract id = F.tract_id 
GROUP BY T.tract_id; 


在 我 们 的 测试 环境 上 ， 对 示例 9-15 的 语句 用 FILTER 替换 CAsE 后 性 能 提升 仅 有 大 约 1 毫 
秒 ， 而 且 两 种 写法 的 执行 计划 也 基本 类 似 。 
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复制 与 外 部 数据 





PostgreSQL 有 很 多 方法 可 以 实现 与 外 部 数据 源 之 间 的 数据 共享 。 第 一 种 就 是 PostgreSQL 
自 带 的 复制 功能 ， 通 过 该 功能 可 以 在 另外 一 台 服 务 器 上 创建 出 当前 服务 器 的 一 个 镜像 。 第 
三 种 方法 是 使 用 第 三 方 插件 ， 其 中 许多 插件 可 以 免费 使 用 ， 并 且 其 可 靠 性 也 是 久 经 考验 
的 。 第 三 种 方法 是 使 用 从 9.1 版 起 开始 支持 的 外 部 数据 封装 器 (Foreign Data Wrapper， 
FDW)。FDW 支持 大 量 的 外 部 数据 源 ， 从 9.3 版 开始 ， 有 些 FDW (比如 postgres_fdw 和 
hadoop_fdw) 也 开始 支持 对 外 部 数据 的 修改 。 


10.1 复制 功能 概览 


很 多 情况 下 我 们 都 需要 使 用 数据 库 复 制 功能 ， 但 不 管 具体 场景 如 何 ， 其 根本 原因 都 可 以 归 
结 为 两 个 : 提升 数据 的 可 用 性 和 可 扩展 性 。 从 可 用 性 的 角度 看 ， 如 果 主 服务 器 宕 机 了， 备 
用 服务 器 应 立即 接管 并 继续 提供 服务 。 对 于 规模 较 小 的 数据 库 来 说 ， 要 达到 此 目标 只 需要 
保证 你 有 另 一 台 备 用 的 物理 服务 器 ， 并 将 数据 库 恢 复 到 该 服务 器 上 即 可 。 但 对 于 规模 很 大 
的 数据 库 (数据 量 为 TB 级 别 ) 来 说 ， 恢 复 过 程 本 身 可 能 需要 好 儿 个 小 时 ， 而 且 此 过 程 中 
系统 无 法 对 外 提供 服务 。 为 尽量 减少 服务 中 断 时 间 ， 你 就 需要 使 用 复制 功能 。 我 们 再 从 可 
扩展 性 的 角度 来 考虑 这 个 问题 ， 假 设 你 开设 了 一 个 网 站 ， 做 着 饲养 并 出 售 象 网 的 买卖 。 做 
了 几 年 之 后 ， 你 已 经 拥有 了 几 千 只 象 网。 全 世界 的 客户 都 涌 到 你 的 网 站 来 查看 并 购买 ， 由 
于 流量 过 大 导致 网 站 过 载 并 无 法 正常 处 理 请 求 ， 那 么 这 时 候 就 需要 复制 功能 出 马 了 。 只 需 
设 定 一 个 只 读 的 从 属 服务 器 作为 主 服务 器 的 镜像 ， 然 后 就 可 以 把 海量 的 读 请 求 分 流 到 从 属 
服务 器 上 ， 只 有 当 买 家 真正 下 单 时 才 需 要 到 主 服务 器 上 执行 操作 。 
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10.1.1 复制 功能 涉及 的 术语 





在 我 们 深入 探讨 复制 功能 之 前 ， 先 介绍 一 下 相关 术语 。 


主 服务 器 (Master) 

主 服务 器 是 作为 要 复制 数据 的 源头 的 数据 库 服 务 器 ， 所 有 更 新 都 在 其 上 发 生 。 使 用 
PostgreSQL 的 内 置 复制 功能 时 ， 仅 允许 使 用 一 个 主 服 务 器 。 已 有 计划 要 支持 多 主 服务 
器 复制 方案 ， 请 关注 未 来 版 本 。 


从 属 服务 器 (Slave) 

从 属 服务 器 使 用 复制 的 数据 并 提供 主 服 务 器 的 副本 。 尽 管 也 有 人 谈 到 一 些 昕 起 来 更 悦耳 
的 术语 ， 比 如 : 订阅 者 (subscriber)、 代 理 (agent) 等 ， 但 从 属 服务 器 (slave) 这 个 名 
称 仍 是 最 贴切 的 。PostgreSQL 内 置 复制 目前 仅 支持 只 读 从 属 服务 器 。 





























预 写 日 志 (Write Ahead Log, WAL) 

WAL 就 是 记录 所 有 已 完成 事务 信息 的 日 志文 件 ， 在 其 他 数据 库 产品 中 一 般 称 为 事务 日 
志 。 为 了 支持 复制 功能 ，PostgreSQL 将 主 服 务 器 的 WAL 日 志向 从 属 服务 器 开放 ， 然 后 
从 属 服务 器 持续 地 将 这 些 日 志 取 到 本 地 ， 然 后 将 其 中 记载 的 事务 重演 一 遍 ， 这 样 就 实现 
了 数据 同步 。 

















同步 复制 (Synchronous ) 

在 事务 提交 阶段 ，PostgreSQL 需 保 证 已 经 将 此 事务 中 所 做 的 修改 成 功 同步 到 至 少 一 个 
从 属 服务 器 ， 然 后 才能 向 用 户 反馈 事务 提交 成 功 。 这 种 工作 模式 保证 了 主 服务 器 和 从 属 
服务 器 的 数据 在 同一 个 事务 内 被 同步 修改 ， 因 此 称 为 同步 复制 。 如 果 配 置 了 多 个 从 属 服 
务 器 ， 只 要 写 入 一 个 成 功 就 算 提交 成 功 。 





























异步 复制 (Asynchronous) 

在 事务 提交 阶段 ， 主 服务 器 上 提交 成 功 就 算 成 功 ， 不 需要 等 待 从 属 服务 器 的 数据 更 新 成 
功 。 当 从 属 服务 器 位 于 远 端 时 该 模式 就 比较 有 用 了 ， 因 为 可 以 避免 网 络 延 退 的 影响 。 但 
有 利 上 必 有 上 弊 ， 该 模式 下 从 属 服务 器 的 数据 更 新 不 够 及 时 ， 与 主 服 务 器 之 间 会 有 一 些 延 
迟 。 当 发 生 传输 失败 时 ， 从 属 服务 器 可 能 会 丢失 一 些 事务 数据 。 

















流 式 复制 (Streaming) 
从 PostgreSQL 9.0 版 开始 支持 流 式 复制 。 在 此 前 的 版 本 中 ，WAL 日 志 是 通过 直接 复制 
文件 的 方式 从 主 服务 器 传递 到 从 属 服务 器 ， 但 在 流 式 复制 模式 下 是 通过 消息 来 传递 的 。 








级 联 复制 (Cascading replication) 

从 9.2 版 开始 ， 一 个 从 属 服务 器 可 以 把 WAL 日 志 传 递 给 另 一 个 从 属 服务 器 ， 而 不 需要 
所 有 的 从 属 服务 器 都 从 主 服 务 器 取 WAL 日 志 ， 这 进一步 减轻 了 主 服务 器 的 负担 。 这 种 
模式 下 ， 有 的 从 属 服务 器 可 以 作为 同步 的 数据 源 从 而 继续 向 别 的 从 属 服务 器 传播 WAL 
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数据 ， 从 这 个 角度 看 ， 其 作用 类 似 于 主 服 务 器 。 注 意 ， 这 种 扮演 着 “WAL 日 志 二 传 手 ” 
角色 的 从 属 服务 器 是 只 读 的 ， 它 们 也 被 称 为 级 联 从 属 服务 器 。 


。 重新 选 主 (Remastering) 
重新 选 主 是 指 从 所 有 的 从 属 服务 器 中 选择 一 个 并 将 其 身份 提升 为 主 服务 器 的 过 程 。 在 
9.2 版 及 之 前 的 版 本 中 ， 如 果 要 支持 重新 选 主 ， 要 求 复制 机 制 必须 使 用 基于 文件 的 WAL 
日 志 传 播 模式 ， 而 不 能 使 用 基于 流 式 消息 的 传播 方式 。9.3 版 中 解除 了 这 个 限制 ， 引 入 
了 基于 流 消息 复制 的 选 主机 制 ， 该 模式 下 选 主 时 仅 依靠 流 消 息 ， 而 不 再 需要 访问 WAL 
日 志文 件 ， 同 时 从 属 服务 器 也 不 需要 经 历 一 次 重新 复制 过 程 。 直 到 9.4 版 为 止 ， 重 新 选 
主 还 会 要 求 整个 数据 库 服 务 重启 一 次 ， 将 来 的 版 本 中 可 能 会 改进 这 一 点 。 



































未 记录 WAL 日 志 的 表 不 能 被 复制 。 


10.1.2 复制 机 制 的 演进 

PostgreSQL 的 复制 机 制 依赖 于 WAL 日 志 的 传播 。 在 9.3 版 之 前 ， 流 式 复制 要 求 发 送 端 和 
接收 端的 硬件 架构 必须 相同 ， 这 样 可 以 保证 传送 的 日 志 流 内 容 能 够 在 接收 端正 确 地 解析 和 
执行 。 在 9.3 版 及 之 后 的 版 本 中 ， 流 式 复制 机 制 已 经 做 到 了 与 硬件 架构 无 关 ， 但 仍然 要 求 
两 端 运行 的 PostgreSQL 服务 器 软件 版 本 相同 。 


PostgreSQL 内 置 的 复制 机 制 在 以 下 大 版 本 中 的 演进 历史 。 


(1) 9.0 版 之 前 ，PostgreSQL 仅 提 供 异 步 温 从 属 服务 器 。 温 从 属 服务 器 是 指 将 WAL 日 志 取 
过 来 之 后 保持 本 端 数据 与 主 服务 器 同步 ， 但 不 提供 对 外 查询 能 力 ， 仅 作为 一 个 备用 服务 
器 存在 。 

(2)9.0 版 引入 了 蜡 步 热 从 属 服务 器 以 及 流 式 复制 机 制 。 异 步 热 从 属 服务 器 允许 用 户 针对 热 
从 属 服务 器 执行 只 读 查 询 ， 流 式 复制 机 制 使 得 日 志 传 递 不 再 依赖 文件 访问 而 是 通过 数据 

库 之 间 的 连接 来 传递 日 志 消 息 。 

(3) 9.1 版 开始 支持 同步 复制 。 

(4)9.2 版 引入 了 对 级 联 复制 的 支持 ， 该 机 制 主要 的 优点 是 可 以 降低 延迟 。 对 于 从 属 服务 器 
来 说 ， 从 临近 的 另 一 个 从 属 服务 器 取得 事务 日 志 要 比 从 遥远 的 主 服务 器 获取 快 得 多 。 


10.1.3 第 三 方 复制 解决 方案 
除了 PostgreSQL 自 带 的 复制 机 制 外 ， 还 有 很 多 第 三 方 提 供 的 复制 工具 ，Slony 和 Bucardo 
是 其 中 应 用 最 广泛 的 两 个 ， 而 且 都 是 开源 的 。 尽 管 PostgreSQL 原生 复制 机 制 在 每 个 版 本 中 
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都 会 得 到 功能 强化 ， 但 Slony、Bucardo 以 及 其 他 第 三 方 工具 仍然 在 灵活 性 方面 有 着 原生 复 
制 机 制 难以 比拟 的 优势 : 它们 支持 仅 复 制 单个 database 或 者 单 张 表 ， 它 们 也 不 要 求 复制 的 
源 端 和 目的 端的 PostgreSQL 版 本 和 操作 系统 相同 ;它们 还 支持 多 主 复制 。 但 它们 也 有 缺 
点 : 两 个 工具 均 依 赖 于 新 建 额 外 的 触发 器 来 触发 复制 动作 ， 因 此 它们 对 系统 架构 有 一 定 的 
“侵入 性 ”; 并 且 它 们 一 般 不 支持 建 表 、 安 装 扩展 包 等 DDL 操作 的 同步 。 

















目前 仍 处 于 BETA 版 阶段 的 PG-XC 项 目 已 经 开始 吸引 了 一 些 用 户 的 注意 。PG-XC 这 个 项 
目的 设计 目标 是 实现 一 套 分 布 式 数据 库 ， 而 不 是 另 一 套数 据 复制 机 制 。 其 设计 思想 更 重视 
的 是 保证 系统 的 可 扩张 性 而 非 高 可 用 性 。PG-XC 不 是 基于 PostgreSQL 的 一 套 插件 ， 而 是 
一 个 完全 独立 的 分 支 ， 致 力 于 提供 一 套 写 能 力 可 扩展 的 多 主 服务 器 对 称 集群 ， 其 目标 非常 
类 似 于 Oracle RAC。 






































我 们 强烈 建议 你 在 决定 使 用 哪 一 种 具体 产品 之 前 参考 一 下 “流行 的 第 三 方 复制 解决 方案 
的 对 比 ” 这 篇 文章 (http://wiki.postgresql.org/wiki/Replication,_Clustering, and_Connection_ 





Pooling ) 。 


10.2 复制 环境 的 搭建 


本 市 中 我 们 会 完整 介绍 一 遍 搭 建 复制 环境 的 所 有 步 双 ,以 下 使 用 9.0 版 开始 支持 的 流 式 
复制 模式 ， 该 模式 基于 主 服务 器 和 从 属 服务 器 之 间 的 数据 库 连 接 来 进行 WAL 日 志 传输 。 
我 们 还 将 使 用 9.1 版 开始 支持 的 一 个 特性 ， 该 特性 可 以 很 简单 地 设置 好 专用 于 复制 的 用 
户 账号 。 

















10.2.1 主 服 务 器 的 配置 


主 服 务 器 的 基本 配置 步骤 如 下 所 示 。 





(1) 创建 一 个 专用 于 复制 的 用 户 账号 。 
CREATE ROLE pgrepuser REPLICATION LOGIN PASSWORD 'woohoo'; 
(2) 在 postgresql.conf 中 设 好 以 下 配置 项 。 


listen addresses = * 
wal_level = hot_standby 
archive mode = on 
max_wal_senders = 2 
wal_keep_segments = 10 


以 上 设置 在 PostgreSQL 官方 手册 的 “服务 器 配置 : 复制 ”这 一 节 (http://www.postgresql.org/ 


docs/current/interactive/runtime-config-replication.html) 中 有 详细 介绍 。 
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(3) 在 postgresql.conf 中 添加 archive_command 配置 指令 ， 该 指令 是 


个 命令 行 字 符 











串 ， 表 示 和 希望 将 WAL 日 志保 存 到 哪里 。 在 流 式 复 制 模式 下 该 配置 指令 中 的 目标 路 
径 可 设 定 为 任何 路 径 。 更 多 有 关 此 配置 指令 的 信息 ， 请 参见 PostgreSQL 官方 手册 中 
的 “PostgreSQL PGStandby 工具 介绍 ”一 节 (http://www.postgresql.org/docs/current/ 


interactive/pgstandby.html) 。 


在 Linux/Unix 上 ，archive_command 行 可 参照 如 下 格式 设 定 : 





archive_command = 'cp %p ../archive/%f' 





你 也 可 以 使 用 rsync 命令 替代 cp 以 实现 异地 归档 : 


archive_command = "rsync -av %p postgresQ192.168.0.10:archive/%f' 





在 Windows 上 可 按 如 下 形式 设 定 : 





archive_command = 'copy %p ..\\archive\\%f' 


(4) 在 pg_hba.conf 文件 中 设置 一 条 权限 规则 ， 以 允许 从 属 服务 器 作为 复制 体系 中 的 客户 端 











连 到 主 服务 器 。 例 如 以 下 这 条 规则 所 代表 的 含义 是 : 允许 一 个 名 为 pgrepuser 的 角色 连 








接 到 主 服务 器 ， 其 IP 地 址 范围 为 192.168.0.1 到 192.168.0.254， 验 证 方式 为 基于 MD5 


的 加 密 密 码 。 


host replication pgrepuser 192.168.0.0/24 md5 


(5) 关 闭 PostgreSQL 服务 然后 将 data 文 件 夹 下 除了 pg_xlog 和 pg log 这 两 个 文件 
夹 以 外 的 所 有 内 容 都 复制 到 从 属 服务 器 相同 的 位 置 。 请 确保 从 属 服 务 器 data 
文件 夹 下 存在 pg_xlog 和 pg log 这 两 个 文件 夹 ， 但 这 两 个 文件 夹 都 是 空 的 。 
如 果 你 的 数据 库 规模 庞大 ， 不 允许 停机 并 实施 数据 冷 复 制 ， 那 么 可 以 使 用 PostgreSQL 

安装 路 和 又 下 的 bin 文件 夹 中 的 pg -basebackup 工具 ， 该 工具 可 以 为 指定 目录 下 的 数据 文 
件 创建 一 份 热 副 本 ， 所 谓 “ 热 副本 ”是 指 postgres 服务 还 在 运行 期 间 就 对 其 实施 数据 














复制 动作 。 


10.2.2 ”从 属 服务 器 的 配置 








建议 从 属 服 务 器 与 主 服务 器 的 各 项 系统 配置 完全 相同 ， 这 会 为 你 减少 很 多 麻烦 ， 特 别 是 当 





你 需要 搭建 一 套用 于 保障 系统 高 可 用 的 主 备 倒 换 环境 时 ， 这 一 点 尤其 重要 。 从 属 服务 器 市 





点 必须 要 能 够 处 理 主 服务 器 发 来 的 WAL 事务 日 志 。 具 体 配置 步骤 如 下 。 


(新 建 一 个 数据 库 实 例 作 为 从 属 服务 器 ， 要 求 采 用 与 主 服 务 器 相同 的 PostgreSQL 版 本 








《最 好 是 小 版 本 号 也 完全 相同 ) ， 并 且 操 作 系 统 也 相同 ， 操 作 系统 打 的 补丁 也 相同 。 事 实 











洒 





上 官方 并 不 要 求 主 服务 器 和 从 属 服务 器 的 软件 平台 完全 相同 ， 其 实 你 可 以 尝试 一 下 ， 看 





看 在 不 一 样 的 情况 下 是 否 能 够 配置 成 功 ， 不 过 我 们 是 不 建议 你 在 生产 环境 上 这 么 做 的 。 
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(2) 关闭 从 属 服务 器 的 PostgreSQL 服务 。 
(3) 使 用 从 主 服务 器 复制 的 data 文件 夹 文件 覆盖 从 属 服务 器 上 的 相应 文件 。 
(4) 将 下 面 的 配置 设置 添加 到 postgresql.conf 文件 中 。 




















hot_standby = on 


(5) 从属 服务 器 的 侦 听 端口 不 必 与 主 服务 器 一 样 ， 因 此 可 以 选择 在 postgresql.conf 中 更 改 端 
口 ， 也 可 以 通过 某 些 其 他 特定 于 操作 系统 的 启动 脚本 进行 更 改 ， 这 些 启动 脚本 会 在 启动 
之 前 设置 PGPORT 环境 变量 。 任 何 启动 脚本 都 将 替代 postgresql.conf 中 的 设置 。 

(6) 在 data 文件 夹 下 创建 一 个 名 为 recovery.conf 的 新 文件 ， 内 容 如 下 (注意 下 面 第 二 行 中 
要 修改 为 真实 的 卫 地 址 和 端口 )。 












































standby_mode = 'on' 

primary_conninfo = 'host=192.168.0.1 port=5432 user=pgrepuser password=woo- 
hoo 

trigger_file = 'failover.now' 


(7) 如 果 发 现 从 属 服务 器 处 理事 务 日 志 的 速度 较 慢 ， 跟 不 上 主 服 务 器 产生 日 志 的 速度 ， 为 避 
免 主 服务 器 产生 积压 ， 你 可 以 在 从 属 服务 器 上 指定 一 个 路 径 用 于 缓存 暂 未 处 理 的 日 志 。 
请 在 recovery.conf 中 添加 如 下 一 个 代码 行 ， 该 代码 行 在 不 同 操作 系统 下 会 有 所 不 同 。 



































Linux/Unix 下 : 

restore_command = 'cp %p ../archive/%f' 
Windows 下 : 

restore_command = 'copy %p ..\\archive\\%f' 





本 示例 中 ， 路 径 中 指定 的 archive 文件 夹 就 是 我 们 用 于 缓存 日 志 的 文件 夹 。 





10.2.3 ”启动 复制 进程 

一 般 情 况 下 ， 我 们 建议 先 启 动 所 有 从 属 服务 器 再 启动 主 服 务 器 ， 如 果 顺 序 反 过 来 ， 会 导致 
主 服务 器 已 经 开始 修改 数据 并 生成 事务 日 志 了 ， 但 从 属 服务 器 却 还 无 法 进行 复制 处 理 ， 这 
会 导致 主 服 务 器 的 日 志 积 压 。 如 果 在 未 启动 主 服务 器 的 情况 下 先 启动 从 属 服务 器 ， 那 么 从 
属 服务 器 日 志 中 会 报错 ， 说 无 法 连接 到 主 服务 器 ， 但 这 没有 关系 ， 忽 略 即 可 。 等 所 有 从 属 
服务 器 都 启动 完毕 后 ， 就 可 以 启动 主 服 务 器 了 。 























此 时 所 有 主 从 属 服务 器 应 该 都 是 能 访问 的 。 主 服务 器 的 任何 修改 ， 包 括 安装 一 个 扩展 包 或 
者 是 新 建 表 这 种 对 系统 元 数据 的 修改 ， 都 会 被 同步 到 从 属 服务 器 。 从 属 服 务 器 可 对 外 提供 


查询 服务 。 











如 果 希 望 某 个 从 属 服务 器 脱离 当前 的 主 从 复制 环境 ， 即 此 后 以 一 台独 立 的 PostgreSQL 服 
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务 器 身份 而 存在 ， 请 直接 在 其 data 文件 夹 下 创建 一 个 名 为 failover.now 的 空 文件 。 从 属 服 
务 器 会 在 处 理 完 当前 接收 到 的 最 后 一 条 事务 日 志 后 停止 接收 新 的 日 志 ， 然 后 将 recovery. 
conf 改名 为 recovery.done。 此 时 从 属 服务 器 已 与 主 服 务 器 彻底 解除 了 复制 关系 ， 此 后 这 人 台 
PostgreSQL 服务 器 会 作为 一 台独 立 的 数据 库 服务 器 存在 ， 其 数据 的 初始 状态 就 是 它 作 为 从 
属 服务 器 时 处 理 完 最 后 一 条 事务 日 志 后 的 状态 。 一 旦 从 属 服务 器 脱离 了 主 从 复制 环境 ， 就 
不 可 能 再 切换 回 主 从 复制 状态 了 ， 要 想 切 回去 ， 必 须 按 照 前 述 步骤 一 切 从 零 开始 。 


10.3 ”外 部 数据 封装 器 

外 部 数据 封装 器 (Foreign Data Wrapper，FDW) 是 PostgreSQL 提供 的 一 种 用 于 访问 外 
部 数据 产 的 手段 ， 它 是 可 扩展 的 ， 也 兼容 业界 标准 。 该 机 制 所 支持 的 外 部 数据 源 包括 
PostgreSQL 以 及 其 他 非 PostgreSQL 数据 源 。FDW 是 在 9.1 版 中 引入 的 ， 其 核心 概念 是 
“外 部 表 ”， 这 种 表 看 起 来 和 当前 PostgreSQL 中 其 他 表 的 用 法 完全 相同 ， 但 事实 上 其 数据 
本 体 是 存在 于 外 部 数据 源 中 的 ， 该 数据 产 甚 至 可 能 存在 于 另外 一 台 物 理 服务 右上。 一 旦 
定义 好 了 外 部 表 ， 那 么 其 定义 就 会 在 当前 数据 库 中 持久 化 ， 你 就 可 以 放心 地 与 使 用 普通 
表 一 样 使 用 它 ，FDW 完全 屏蔽 了 与 外 部 数据 源 之 间 的 复杂 通讯 过 程 。 可 以 通过 PGXN 
FDW 页 面 (http://pgxn.org/tag/fdw/) 和 PGXN Foreign Data Wrapper 页 面 (http://pgxn.org/ 
tag/foreign%20data%20wrapper/) 查 到 PostgreSQL 的 FDW 的 一 个 catalog。 也 可 以 通过 
PostgreSQL Wiki FDW (http://wiki.postgresql.org/wiki/Foreign_data_wrappers) 页 面 来 找到 
FDW 的 用 法 示例 。 





























































































































当前 最 新 版 本 的 PostgreSQL 安装 时 会 默认 安装 两 个 FPDW: file_fdw 和 postgres_fdw。 如 
果 你 需要 自行 封装 某 个 外 部 数据 源 ， 那 么 请 先 到 前 面 提供 的 两 个 站 点 查询 一 下 别人 是 否 已 
实现 ， 如 果 没 有 ， 再 自己 做 。 如 果 封 装 成 功 ， 请 记得 发 布 出 来 与 社区 分 享 。 




















在 PostgreSQL 9.1 版 和 9.2 版 中 ， 仅 支持 对 外 部 表 进 行 查询 ，9.3 版 中 引入 了 一 组 新 的 API 
实现 了 对 外 部 表 的 修改 ， 但 PostgreSQL 自 带 的 FDW 中 只 有 postgres_fdw 支持 此 特性 。 





本 节 中 ， 我 们 将 向 你 演示 如 何 注 册 外 部 服务 器 、 外 部 用 户 以 及 外 部 表 ， 最 后 介绍 如 何 
查询 外 部 表 。 我 们 使 用 的 例子 中 都 使 用 SQL 命令 行 来 创建 和 删除 对 象 ， 你 也 可 以 通过 
pgAdminIII 的 图 形 化 界面 工具 来 实现 相同 的 操作 。 

















10.3.1 查询 平面 文件 
可 以 使 用 file_fdw 这 个 FDW 来 查询 平面 文件 ， 它 是 以 扩展 包 的 形式 存在 的 ， 因 此 可 以 通 
过 以 下 SQL 安装 : 

















CREATE EXTENSION file_fdw; 


尽管 通过 file_fdw 可 以 直接 读 取 数 据 库 实例 所 在 的 本 地 服务 器 上 的 文件 ， 但 为 了 和 别 的 
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FDW 在 语义 上 保持 一 致 ， 还 是 得 定义 一 个 逻辑 上 的 外 部 服务 器 。 请 执行 以 下 命令 来 定义 
一 个 “ 伪 ” 外 部 服务 器 : 


CREATE SERVER my_server FOREIGN DATA WRAPPER file_fdw; 


接 下 来 要 注册 外 部 表 。 你 可 以 将 外 部 表 置 于 任何 一 个 schema 中 ， 但 我 们 一 般 是 创建 一 个 
单独 的 schema 来 容纳 所 有 的 外 部 表 。 


示例 10-1: 定义 基于 分 隔 符 格式 文件 的 外 部 表 
CREATE FOREIGN TABLE staging.devs (developer VARCHAR(150), company VARCHAR(150)) 
SERVER my_server 
OPTIONS (format 'csv', header 'true', filename '/postgresqL_book/ch10/devs.psv ' ， 
delimiter '|', null '' 


治 


上 面 的 示例 中 ， 尽 管 外 部 表 映 射 到 一 个 用 竖 杠 作为 分 隔 符 的 平面 文件 ， 但 我 们 依然 将 其 标 
识 为 “csv” 格 式 。 有 人 可 能 会 根据 CSV (Comma Seperated Vlues) 的 名 称 认 为 只 有 用 去 
号 作为 分 隔 符 的 文件 才能 称 为 CSV， 但 在 FDW 的 术语 体系 中 ，CSYV 文件 就 是 以 某 种 分 隔 
符 来 区 分 列 值 的 平面 文件 ， 不 管 这 个 分 隔 符 具体 是 什么 字符 ， 都 可 以 称 之 为 CSV。 


上 述 定义 步 又 完成 后 ， 你 就 可 以 直接 通过 SQL 访问 外 部 表 了 : 




















SELECT * FROM staging.devs WHERE developer LIKE 'T%'; 
如 果 不 再 需要 此 外 部 表 ， 可 以 删 掉 : 


DROP FOREIGN TABLE staging.devs; 


10.3.2 ”以 不 规则 数组 的 形式 查询 不 规范 的 平面 文件 

通常 ， 平 面 文件 数据 源 在 每 一 行 中 会 有 许多 不 同 的 列 ， 并 且 包 含 多 个 标题 行 和 页 脚 行 。 如 
果 平 面 文 件 起 源 于 电子 表格 ， 那 么 这 些 种 类 的 文件 往往 是 普遍 存在 的 。 我 们 最 喜欢 的 处 理 
这 种 非 结 构 化 平面 文件 的 平面 文件 FDW 是 file_textarray_fdw。 该 包装 器 能 处 理 任何 种 
类 的 带 分 隔 符 的 平面 文件 ， 即 时 每 一 行 中 的 元 素数 量 不 一 臻 也 可 以 。 该 包装 器 将 每 一 行 作 
为 一 个 文本 数组 (text[]) 带 进 来 。 










































































问题 是 file_textarray_fdw 不 是 PostgreSQL 原生 支持 的 扩展 包 ， 因 此 你 必须 手动 编译 安 
装 它 。 大 致 过 程 如 下 : 首先 ， 你 在 安装 PostgreSQL 时 需要 附带 安装 系统 头 文件 以 便于 后 续 
的 编译 ， 然 后 从 Adunstan GitHub 这 个 站 点 (https://github.com/adunstan/file_text_array_fdw) 
下 载 file_textarray_fdw 的 源码 。 请 注意 : 该 站 点 上 为 每 个 PostgreSQL 版 本 都 准备 了 相 
应 的 源码 ， 请 确保 选择 的 是 正确 的 版 本 。 在 编译 完成 后 ， 请 将 它 以 扩展 包 的 形式 安装 好 ， 
该 过 程 与 我 们 前 面 介绍 过 的 安装 其 他 FDW 的 过 程 完全 相同 。 



































如 果 你 的 环境 是 Linux/Unix， 只 要 安装 了 postgresql-dev 这 个 包 ， 那 么 编译 过 程 是 很 简单 
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的 ,但 在 Windows 上 就 比较 麻烦 ， 所 以 我 们 已 经 为 你 编译 好 了 安装 包 ， 你 可 以 从 以 下 几 个 
链接 中 选择 合适 的 版 本 下 载 。 





。 Windows-32 9.1 FDW (http://www.postgresonline.com/downloads/fdw_win32_91_bin.zip) 
。 Windows-32 9.2 FDW (http://www.postgresonline.com/downloads/fdw_win32_92_bin.zip) 
。 Windows-64 9.2 FDW (http://www.postgresonline.com/downloads/fdw_win64_92_bin.zip) 
。 Windows-329.3FDW ( 
。 Windows-649.3 FDW (http://www.postgresonline.com/downloads/fdw_win64_93_bin.zip) 


ttp://www.postgresonline.com/downloads/fdw_win32_93_bin.zip ) 


FDW 安装 好 以 后 ， 首 先 创建 扩展 包 。 





CREATE EXTENSION file textarray_fdw; 


然后 就 跟 安装 其 他 FDW 时 一 样 ， 创 建 好 外 部 服务 器 。 





CREATE SERVER file_ taserver FOREIGN DATA WRAPPER file textarray_fdw; 


然后 设置 外 部 表 ， 可 以 将 外 部 表 放 入 任何 一 个 你 认为 合适 的 schema 中 。 在 示例 10-2 中 ， 
我 们 将 再 次 使 用 前 面 用 过 的 staging schema。 


示例 10-2: 创建 一 个 基于 文本 数组 的 外 部 表 
CREATE FOREIGN TABLE staging.factfinder_array (x text[]) 
SERVER file_taserver 
OPTIONS (format 'csv', filename '/postgresql_book/ch10/ 
DEC_10_SF1_QTH1_with_ann.csv', 


header 'false', delimiter ',', quote '"' 
有 


假设 我 们 要 处 理 这 样 一 个 CSV 文件 : 文件 中 含有 8 个 标题 行 ， 而 列 数 多 得 我 们 不 想 数 。 
当前 述 设置 步骤 都 完成 后 ， 就 可 以 直接 查询 这 个 文件 的 内 容 了 。 通 过 以 下 查询 可 以 得 到 标 
题 行 的 名 称 ， 这 些 标题 行 的 第 一 个 列 标 头 为 GE0.id。 




















，encoding 'latin1', null '' 























SELECT unnest(x) FROM staging.factfinder_array WHERE x[1] = 'GEO.id' 





以 下 查询 能 查 出 数据 的 前 两 列 。 


SELECT x[1] As geo_id, x[2] As tract id FROM staging.factfinder_array WHERE 
x[1] ~ '[9-9]+'; 








当 不 再 需要 此 外 部 表 时 ， 可 以 删除 它 。 


DROP FOREIGN TABLE staging.factfinder_array; 


10.3.3 ”查询 其 他 PostgreSQL 服 务实 例 上 的 数据 


postgres_fdw 可 以 实现 从 当前 PostgreSQL 实例 连接 到 其 他 PostgreSQL 实例 并 进行 数据 交 














互 。 从 9.3 版 开始 ， 大 多 数 的 PostgreSQL 发 行 包 都 包含 了 该 FDW。 通 过 它 还 可 以 对 其 他 
PostgreSQL 服务 器 上 的 数据 进行 修改 操作 ， 哪 怕 两 边 的 PostgreSQL 版 本 不 一 致 也 没关系 。 


首先 也 是 要 进行 FPDW 扩展 包 的 安装 。 
CREATE EXTENSION postgres_fdw; 


然后 仓 





ds 


建 外 部 服务 器 。 
CREATE SERVER book_server 


FOREIGN DATA WRAPPER postgres_fdw 
OPTIONS (host 'localhost', port '5432', dbname 'postgresql_book'); 


如 果 创 建 好 外 部 服务 器 后 需要 更 改 连 接 选 项 或 将 其 添加 到 外 部 服务 器 ， 则 可 以 使 用 ALTER 
SERVER 命令 。 比 如 ， 如 果 需 要 更 改 你 所 指向 的 服务 器 ， 可 以 执行 以 下 代码 行 。 


ALTER SERVER book_server OPTIONS (SET host "prod ' ); 





对 于 主机 、 端 口 和 database 这 几 项 的 连接 设置 的 更 改 只 对 新 建立 的 会 话 生 
效 ， 不 会 影响 到 已 有 的 会 话 。 原 因 是 会 话 在 开始 时 建立 ， 此 后 就 一 直 复 用 ， 
而 不 会 断 开 重 连 。 

















然后 创建 一 个 用 户 映 射 关 系 ， 所 谓 “用 户 映射 ”是 指 在 远 端 服务 器 的 某 个 角色 和 本 地 服务 
器 的 某 个 角色 之 间 建 立 对 应 关系 ， 这 样本 地 角色 可 以 用 远 端 角色 的 权限 来 操作 远 端 服务 器 
上 的 数据 。 下 面 的 示例 中 是 将 远 端 的 某 个 角色 映射 到 本 地 的 pubtic 角色 。 














CREATE USER MAPPING FOR public SERVER book_server 
OPTIONS (user 'role on _ foreign', password 'your_password'); 


这 样 任何 能 连 到 本 地 数据 库 的 用 户 都 可 以 连 到 远 端 数据 库 。 注 意 : 上 述 映射 关系 中 的 远 端 
角色 必须 是 一 个 已 存在 的 角色 ， 并 且 得 有 登录 权限 。 


现在 可 以 创建 外 部 表 了 。 该 表 可 以 映射 远 端 表 的 全 部 或 部 分 列 。 在 示例 10-3 中 ， 我 们 创建 
了 一 个 外 部 表 ， 映 射 到 远 端 数据 库 上 的 censu.facts 表 。 








示例 10-3: 定义 一 个 映射 到 远 端 PostgreSQL 数据 库 的 外 部 表 
CREATE FOREIGN TABLE ft_facts ( 
fact_type_id int NOT NULL, tract_id varchar(11) ， 
yr int, val numeric(12,3), perc numeric(6,2)) 
SERVER book_server OPTIONS (schema_name 'census', table name 'facts'); 


上 面 的 示例 仅 包 含 外 部 表 的 最 基本 的 选项 。 默 认 情 况 下 ， 了 映射 到 远 端 PostgreSQL 数据 库 的 
外 部 表 都 是 可 更 新 的 ， 当 然 前 提 是 映射 关系 中 所 使 用 的 远 端 数据 库 角 色 对 映射 的 远 端 表 要 
有 修改 权限 。 该 updatable 设置 是 一 个 布尔 设置 ， 可 以 在 定义 外 部 表 或 者 外 部 服务 器 时 进 
行 更 改 。 例 如 ， 如 果 想 把 外 部 表 设 定 为 只 读 ， 可 以 执行 以 下 代码 行 。 
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ALTER FOREIGN TABLE ft_facts OPTIONS (ADD updatable 'false'); 
要 将 表 设 置 回 updatable 状态 ， 请 执行 以 下 代码 行 。 
ALTER FOREIGN TABLE ft_facts OPTIONS (SET updatable 'true'); 


表 级 别 上 的 updatable 属性 会 替代 外 部 服务 器 设置 。 





ALTER FOREIGN TABLE 语 名 除了 可 以 更 改 OPTIONS 之 外 ， 还 可 以 添加 或 者 删除 列 。 有 关 访 
语句 的 详细 介绍 ， 请 参见 PostgreSQL 官方 手册 中 的 ALTER FOREIGN TABLE 这 一 市 
(http://www.postgresql.org/docs/current/static/sql-alterforeigntable.html) 。 





10.3.4 查询 非 传统 数据 源 

长 久 以 来 ,数据库 界 多 元 化 的 趋势 有 增 无 减 ， 各 种 架构 大 相 径 庭 的 数据 库 如 雨 后 春 算 般 层 
出 不 穷 ， 要 想 紧 密 跟 上 业界 少 流 十 分 困难 。 这 些 异彩 纷呈 的 数据 库 中 ， 有 的 只 是 县 花 一 
现 ， 喧 周一 阵子 就 消失 无 踪 ， 有 的 是 立志 要 将 传统 的 关系 型 数据 库 挑 落马 下 ; 更 有 另类 者 
甚至 看 起 来 根本 就 不 像 是 数据 库 。FDW 功能 的 引入 就 是 PostgreSQL 对 这 一 百花齐放 局 正 
的 应 对 策略 之 一 。 不 管 外 界 如 何 风云 变幻 ，PostgreSQL 无 需 改 变 自身 的 核心 功能 ， 而 是 通 
过 FDW 搭建 与 这 些 异 构 数据 库 之 间 沟 通 的 桥梁 。 


在 下 面 的 例子 中 ， 我 们 将 展示 如 何 使 用 www_fdw 来 查询 来 自 Web 服务 的 数据 。 该 示例 是 从 
www_fdw Examples 站 点 (https:Wgithub.com/cyga/www_fdw/wiki/Examples) 借鉴 而 来 。 





















































PostgreSQL 发 行 包 是 不 附带 www_fdw 的 ， 因 此 需要 自行 编译 安装 。 如 果 你 使 用 的 是 Linux/ 
Unix 环境 并 且 已 安装 了 postsqL-dev 这 个 包 ， 那 么 编译 是 很 容易 的 。 请 从 https://github. 
com/cyga/www_fdw 这 个 链接 下 载 最 新 版 本 的 www_fdw 源码 。 对 于 Windows 平台 来 说 ， 我 
们 已 经 替 你 编译 好 了 ， 下 载 链接 如 下 : 














。 Windows-32 9.1 (http://www.postgresonline.com/downloads/fdw_win32_91_bin.zip) 
。 Windows-64 9.3 (http://www.postgresonline.com/downloads/fdw_win64_93_bin.zip) 


首先 安装 FDW 扩展 包 。 
CREATE EXTENSION www_fdw; 

然后 创建 针对 Google Web 服务 的 外 部 服务 器 。 
CREATE SERVER www_fdw_server_google search 


FOREIGN DATA WRAPPER www_fdw 
OPTIONS (uri 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0'); 





www_fdw 默认 支持 JSON 格式 数据 源 ， 因 此 我 们 不 需要 在 上 述 语句 的 OPTIONS 修饰 符 中 特地 
声明 数据 源 格式 。 此 外 www_fdw 还 支持 XML 格式 数据 源 。 如 果 想 了 解 更 多 www_fdw 所 支 
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持 的 形 参 的 详细 信息 ， 请 参阅 其 官方 文档 www_fdw (https://github.com/cyga/www_fdw/wiki/ 
Documentation) 。 请 注意 : 每 一 个 EDW 都 有 其 独特 的 设置 ， 互 不 相同 。 





接 下 来 选 定 至 少 一 个 本 地 角色 来 创建 FDW 用 户 映射 关系 。 每 个 能 连 到 本 地 库 上 的 用 户 
都 应 该 有 权限 访问 Google 搜索 服务 器 ， 因 此 我 们 将 远 端 数据 源 的 访问 权限 映射 给 本 地 的 
public 角色 。 





CREATE USER MAPPING FOR public SERVER www_fdw_server_google_search; 








然后 创建 外 部 表 ， 如 下 面 的 示例 所 示 。 
示例 10-4: 基于 Google Web 服务 数据 源 创建 一 个 外 部 表 


CREATE FOREIGN TABLE www_fdw_google search ( 
q text, 
GsearchResultClass text, 
unescapedUrl text, 
url text, 
visibleUrl text, 
cacheUrl text, 
title text, 
content text 
) SERVER www_fdw_server_google_search; 





前 面 设置 用 户 映射 关系 时 未 指定 任何 权限 ， 因 此 需要 进行 一 次 授权 动作 ， 然 后 才 可 以 访问 
外 部 表 。 





GRANT SELECT ON TABLE www_fdw_google_search TO public; 


请 注意 ， 现 在 最 精彩 的 部 分 来 了 : 我 们 以 New in PostgreSQL 9.4 作 为 关键 词 进行 搜索 ， 
并 用 正则 表达 式 筛 选 掉 返回 结果 中 的 HTML 标签 ， 语 名 如 下 所 示 。 








SELECT regexp_replace(title, E'(?x)(< [^>]*? >)', '', 'g') As title 
FROM www_fdw_google_search where q='New in PostgreSQL 9.4' 
LIMIT 2; 





瞧 吧 ! 我 们 真 的 得 到 了 想 要 的 搜索 结果 。 


What's new in PostgreSQL 9.4 - PostgreSQL wiki 
PostgreSQL: PostgreSQL 9.4 Beta 1 Released 
(2 rows) 
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附录 A 
PostgreS$QL 的 安装 





A.1 Windows 以 及 桌面 Linux 环 境 


EnterpriseDB 公司 (http://www.enterprisedb.com/) 为 Windows 和 桌面 Linux 环境 提供 了 安 
装 包 。 我 们 推荐 Windows 用 户 使 用 此 安装 包 。 


基于 图 形 化 界面 的 安装 包 使 用 非常 简单 ， 其 中 还 附带 了 pgAdmin 以 及 一 款 辅助 安装 工 
具 StackBuilder， 通 过 它 可 以 为 PostgreSQL 安装 一 些 插件 和 辅助 工具 ， 比 如 JDBC 了 驱 
动 、.NET 驱动 、Ruby 驱动 、phpPgAdmin 管理 工具 和 pgAgent 任务 调度 器 等 。 
































EnterpriseDB 提供 了 两 个 版 本 的 PostgreSQL 安装 包 : 一 个 是 官方 开源 版 ， 也 叫 社 区 版 ， 另 
一 个 是 商业 版 ， 也 叫 Advanced Plus 版 。 后 者 提供 了 对 Oracle 语法 的 兼容 以 及 一 些 比 社区 
版 更 强大 的 管理 功能 。 这 两 个 版 本 是 有 区 别 的 ， 下 载 时 请 勿 弄 错 。 本 书 中 我 们 讨论 的 所 有 
内 容 都 是 针对 官方 开源 版 ， 而 非 闭 源 的 Postgres Plus Advanced Servers 版 。 不 过 由 于 二 者 
出 自 同 源 ， 所 以 本 书 绝 大 部 分 内 容 对 于 后 者 也 是 适用 的 。 











如 果 和 希望 在 同一 台 机 器 上 免 安 装 试 用 一 下 不 同 版 本 的 PostgreSQL， 或 者 是 
希望 从 USB 设备 启动 PostgreSQL， 那 么 EnterpriseDB 公司 提供 了 一 种 免 
安装 的 解决 方案 ， 具体 内容 请 参考 “在 Windows 下 以 免 安 装 的 方式 启动 
PostgreSQL” 这 篇 文章 (http:/www.postgresonline.com/journal/archives/172- 














Starting-PostgreSQL-in-windows-without-install.html) 四 
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A.2 _ CentOS、Fedora、Red Hat 以 及 Scientific 


Linux 


大 多 数 Linux/Unix 发 行 版 会 在 其 软件 存储 库 中 提供 PostgreSQL， 但 版 本 可 能 比较 老 。 为 了 
解决 这 个 问题 ,很 多 人 会 使 用 逆向 移植 (“逆向 移植 ”英文 为 backport， 是 指 将 新 版 本 的 软 
件 一 一 比如 数据 库 软 件 、 工 具 软 件 、 补 丁 包 等 一 一 逆向 移植 到 老 版 本 的 操作 系统 上 ， 这 样 
构建 出 来 的 版 本 包 既 能 维持 平台 兼容 性 ， 又 能 提供 新 的 软件 特性 ， 从 而 以 最 小 的 代价 解决 
了 老 版 本 软件 存在 的 问题 ， 与 全 面 升 级 操作 系统 平台 相 比 ， 这 是 一 种 兼容 性 好 、 风 险 低 的 
解决 方案 ) 的 版 本 包 ， 这 种 版 本 包 的 软件 存储 库 中 会 提供 较 新 版 本 的 PostgreSQL 软件 。 


对 于 具有 冒险 精神 的 Linux 用 户 来 说 ， 可 以 从 PostgreSQL Yum 存储 库 (http://yum. 
postgresql.org/) 下 载 最 新 版 本 的 PostgreSQL， 包 括 开发 中 的 版 本 。 此 存储 库 中 不 仅 包含 
PostgreSQL 服务 器 核心 组 件 ， 还 包含 比较 常用 的 扩展 包 。PostgreSQL 的 开发 团队 负责 维护 
这 个 存储 库 ， 并 且 会 在 第 一 时 间 发 布 补丁 和 版 本 更 新 。 在 本 书写 作 之 时 ，PostgreSQL Yum 
存储 库 支 持 的 操作 系统 平台 包括 Fedora 14-20、Red Hat Enterprise Linux 4-6、CentOS 4-6 
以 及 Scientific Linux 5-6。 如 果 使 用 的 操作 系统 平台 较 老 或 者 是 仍 需 要 PostgreSQL 8.3 版 这 
样 的 老 版 本 ， 那 么 是 无 法 使 用 最 新 的 PostgreSQL Yum 存储 库 的 ， 请 检查 一 下 所 使 用 的 操 
作 系 统 平台 的 老 版 本 存储 库 ， 检 查 一 下 存储 库 仍 在 维护 哪些 内 容 。 如 果 希 望 了 解 更 多 基于 
YUM 的 软件 安装 机 制 ， 请 参考 我 们 的 PostgresOnline 网 站 上 关于 Yum 部 分 的 内 容 (http:/ 


www.postgresonline.comyjournal/categories/53-yum ) 。 





















































A.3 _ Debian 和 Ubuntu 


Ubuntu 一 直 都 会 在 其 发 行 版 中 提供 最 新 版 本 的 PostgreSQL。Debian 的 跟 进 会 稍微 慢 一 些 。 
可 以 使 用 以 下 命令 安装 最 新 版 本 的 PostgreSQL。 





























sudo apt-get instaLL postgresqL-9.3 


如 果 你 需要 编译 PostgreSQL 版 本 中 未 附带 的 扩展 包 ， 比 如 PostGIS 或 者 R， 那 么 需要 先 安 
装 开发 库 ， 命 令 如 下 所 示 。 











sudo apt-get install postgresql-server-dev-9.3 


如 果 你 的 操作 系统 存储 库 中 未 包含 最 新 版 本 的 PostgreSQL， 那 么 请 访问 Apt PostgreSQL 
packages (https://wiki.postgresql.org/wiki/Apt) 资源 页 面 以 获取 最 新 的 稳定 版 或 者 测试 版 ， 
此 页 面 上 还 同时 提供 一 些 其 他 的 安装 包 ， 比 如 PL/V8 和 PostGIS 等 。 截 至 本 书 截 稿 时 为 
止 ， 该 页 面 中 提供 支持 的 操作 系统 包含 Debian 6-7 和 Ubuntu 10-14。 
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A.4 FreeBSD 


FreeBSD 是 一 个 常用 的 PostgreSQL 平台 。 不 过 很 多 FreeBSD 用 户 一 般 倾向 于 直接 从 源码 
编译 安装 PostgreSQL 而 不 是 使 用 一 个 现成 的 安装 包 。 你 可 以 从 此 链接 获取 到 最 新 的 适用 于 
FreeBSD 平台 的 PostgreSQL 测试 版 代码 : http:Wwww.freebsd.org/ports/database.html。 


A.5 Mac OSX 


在 Mac 机 器 上 安装 PostgreSQL 有 很 多 方法 : EnterpriseDB 公司 提供 了 独立 安装 包 ， 
Homebrew 包 管 理 器 使 用 越 来 越 广泛 ， 并 且 已 经 吸引 了 一 些 高 级 Mac 用 户 ; KyngChaos 
这 个 站 点 上 提供 了 最 新 最 全 的 开源 GIS 系统 的 下 载 ，Postgres.app 是 新 近 出 现 的 一 个 应 
用 ， 但 很 适合 新 手 们 使 用 ， 另 外 历史 悠久 的 MacPorts 和 Fink 这 两 个 软件 发 布 平 台 也 还 在 
继续 提供 服务 。 可 以 看 到 ，Mac 可 用 的 安装 源 很 多 ， 但 我 们 建议 Mac 用 户 最 好 从 相同 的 
数据 源 下 载 安装 包 。 比 如 ， 你 从 KyngChaos 上 下 载 安装 了 PostgreSQL， 那 么 最 好 不 要 到 
EnterpriseDB 网 站 上 去 下 载 扩展 包 ， 因 为 可 能 会 出 现 不 兼容 问题 。 详 情 如 下 所 示 。 






































。 EnterpriseDB 公司 (http:Wwww.enterprisedb.com) 为 Mac OS X 提供 了 一 个 非常 易 用 的 
一 键 式 PostgreSQL 安装 包 ， 附 带 了 pgAdmin 管理 工具 。 此 外 该 公司 还 提供 了 一 个 名 为 
stack builder 的 软件 ， 通 过 它 可 以 下 载 常用 扩展 包 、 驱 动 程序 、 编 程 语言 扩展 以 及 管理 
工具 等 。 

。 Homebrew (http://brew.sh) 是 Mac OS 下 的 一 个 安装 包 管 理 器 ， 支 持 包 括 PostgreSQL 

在 内 的 很 多 软件 的 安装 管理 。 Russ Brooks 提供 了 一 篇 使 用 Homebrew 安装 PostgreSQL 9.1 
版 的 安装 指南 (http://www.russbrooks.com/2010/11/25/install-postgresql-9-on-os-x)， 你 也 
可 以 参照 这 篇 文档 来 安装 9.1 版 之 后 的 PostgreSQL 版 本 ， 因 为 安装 过 程 几乎 没有 任何 差 
异 。“ 利 用 Brew 管理 器 将 PostgreSQL 从 9.2 版 升级 到 9.3 版 ”(https://mattbrictson.com/ 
postgresql-93-brew-upgrade) 这 篇 博文 提供 了 版 本 升级 的 操作 指导 。 你 还 能 在 Homebrew 
PostgreSQL Wiki 站 点 (https://wiki.postgresql.org/wiki/Homebrew) 看 到 大 量 有 价值 的 相 
关 文 章 。 

。 由 Heroku 开发 团队 提供 的 PostgreSQL.app (http://postgresapp.com/) 是 一 个 免费 的 桌面 
应 用 安装 包 ， 号 称 是 Mac 平台 上 最 方便 最 易 用 的 PostgreSQL 安装 包 。 该 安装 包 一 般 都 
是 基于 最 新 版 本 的 PostgreSQL 构建 ， 其 中 还 附带 了 常用 的 扩展 包 ， 比 如 PostGIS、PL/ 
Python 和 PL/V8 等 。Postgres.app 作为 一 个 独立 的 应 用 程序 运行 ， 可 以 按 需 启动 和 停止 ， 
非常 适合 用 于 开发 ， 也 适用 于 单 用 户 场景 。 

。 KyngChaos 站 点 (http:/www.kyngchaos.com/software:postgres) 的 内 容 是 面向 GIS 用 户 
的 ， 上 面 不 但 提供 了 最 新 版 本 的 PostgreSQL 安装 包 ， 还 提供 了 PostGIS、pgRouting、R 
语言 和 QGIS 等 扩展 包 。 
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。 MacPorts (http://www.macports.org/) 是 Mac OS X 平 台 上 的 一 个 软件 发 布 平台 ， 支 持 
大 量 的 开源 软件 ， 可 以 实现 软件 包 的 编译 、 安 装 、 升 级 等 操作 。 该 系统 是 Mac 操作 系 
统 上 最 早 支持 PostgreSQL 的 软件 发 布 平台 。 本 书写 作 之 时 ， 该 平台 支持 的 最 新 版 本 是 
PostgreSQL 9.3 版 。 

。 Fink (http:/www.finkproject.org/) 是 Mac OS X 上 的 另 一 个 软件 发 布 平 台 ， 底 层 基 于 
Debian 的 apt-get 软件 安装 框架 。 本 书写 作 之 时 ， 它 提供 9.2 版 的 PostgreSQL， 相 比 其 
他 发 布 平 台 稍 显 落后 。 
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附录 B 
PostgreSQL 自 带 的 命令 行 工具 





以 下 内 容 集中 介绍 了 PostgreSQL 的 必 备 命令 行 工具 ， 本 书 的 正文 部 分 已 经 对 它们 的 功能 进 
行 了 翔实 的 介绍 ， 此 处 仅 列 出 它们 的 帮助 信息 。 我 们 希望 通过 提供 这 部 分 内 容 来 为 你 节省 
一 些 时 间 ， 也 希望 能 让 这 本 书 成 为 你 更 好 的 工作 助手 。 


B.1 使 用 pg_dump 进 行 数据 库 备 份 


pg_dump 可 备份 一 个 database 的 全 部 或 者 部 分 数据 。 支 持 的 备份 格式 有 : TAR 包 格 式 、 
PostgreSQL 自 定义 压缩 格式 、 纯 文本 格式 以 及 SQL 文本 格式 。 纯 文本 格式 转 储 的 内 容 
中 含有 psql 专 有 命令 行 ， 因 此 恢复 时 也 需要 通过 psql 工具 来 执行 此 文本 。SQL 文本 格 
式 转 储 的 是 仅 包含 标准 CREATE 和 INSERT 命令 的 SQL 脚本 ,恢复 时 你 可 以 使 用 psql 或 者 
pgAdmin 工具 来 运行 该 脚本 。 示 例 B-1 显示 的 是 pg_dump 命令 的 帮助 信息 。 如 果 要 了 解 
pg_dump 的 全 部 用 法 ， 请 参见 2.7.1 节 。 














示例 B-1: pg_dump 帮助 信息 
pg_dump --help 





pg_dump 可 将 某 个 database 转 储 为 文本 文件 或 者 其 他 格式 文件 。 
用 法 : 
pg_dump [选项 ]... [database 名 ] 














通用 选项 : 

-f, --file=FILENAME 输出 文件 名 或 者 目录 名 

-F，--format=c|ldltlp 输出 文件 格式 ( 自 定 义 格式 .目录 格式 .tar 包 格式 、 纯 文本 ) 
-j，- -jobs=NUN 使 用 这 多 个 并 行 作 业 进 行 转 储 @ 

-v, --verbose 详细 信息 模式 
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O00 
© 


© 


-Z，--Compress=0-9 
--lock-wait-timeout=TIMEOUT 
--help 

--vVersion 


控制 输出 内 容 的 选项 : 


-da, --data-only 

-b, --blobs 

-C，--CLean 

-C，--Create 

-E, --encoding=ENCODING 
-n,--schema=SCHEMA 

-N, --exclude-schema=SCHEMA 
-0，--oids 

-0，--no-owner 
-S，--Schema-onLy 
-9，--SUperuser=NAME 

-七 ，- -tabLe=TABLE 
-T，--excLude-tabLe=TABLE 
-X，--no-priviLeges 


--binary-upgrade 
--Ccolumn-inserts 
--disable-dollar-quoting 
--disable-triggers 
--exclude-table-data=TABLE 
--if-exists 

--inserts 
--no-security-labels 
--Nno-synchronized-snapshots 


--no-tablespaces 
--no-unlogged-table-data 
--quote-all-identifiers 
--Section=SECTION 


--serializable-deferrable 


--Use-set-session-authorization 使 月 





压缩 格式 的 压缩 级 别 

等 待 表 锁 超时 后 操作 失败 
显示 此 帮助 信息 # 
输出 版 本 信息 并 退出 

































































仅 转 储 数据 ,而 不 转 储 schema 
在 转 储 中 包含 大 对 象 


























包含 用 于 在 转 储 中 创建 数据 库 的 命令 








以 ENCODING 编 码 格式 转 储 数据 
仅 转 储 命 名 schema 

不 转 储 命 名 schema 

在 转 储 中 包含 0ID 





DY 


以 纯 文本 格式 跳 过 对 象 所 有 权 的 恢复 





仅 转 储 schema , 而 不 转 储 数 ] 
要 以 纯 文本 格式 使 用 
仅 转 储 命名 表 
不 转 储 命名 表 
不 转 储 特权 (grant/revoke) 
仅 供 升 级 工具 使 用 
以 带 


二 



































有 列 名 的 INSERT 命 令 的 形式 转 储 数据 


的 超级 用 户 用 户 名 





禁用 美元 (符号 ) 引 号 ,而 是 使 用 SQL 标准 引号 








间 禁 用 触发 器 




















删除 对 象 时 使) jIF EXISTS © 








以 INSERT 命 令 ( 而 非 COPY 命 令 ) 的 形式 转 储 数据 


不 转 储 安全 标签 分 配 
在 并 行 作业 中 不 使 用 























PostgreSQL 9.2 版 之 前 的 版 本 上 使 用 pg_dump 


不 转 储 表 空 间 分 配 





不 转 储 不 记录 AL 日志 的 表 的 数 ] 





同步 快照 ,通过 设置 该 选项 可 以 允许 在 
-j 并 发 转 储 @ 





居 


所 有 标识 符 加 引号 ,即使 不 是 关键 字 也 加 





转 
data 部 分 包含 表 记 录 数 





data 部 分 包含 索引 、 触 发 器 、 规 见 





和 约束 (除了 验证 





重新 创建 数据 库 对 象 之 前 清除 (删除 ) 数 据 库 对 象 





渚 命名 部 分 (包括 三 个 部 分 :pre-data、datal 以 及 post-data。 
居 、 大 对 象 数据 以 及 序列 的 值 ;post- 


检查 约束 ) 


的 定义 ;pre-data 部 分 包含 此 外 其 他 所 有 的 对 象 定义 ) © 


等 待 直至 转 储 正常 运行 为 止 



































令 来 设置 所 有 权 

连接 选项 : 

-d，- -dbname=DBNAME 要 转 储 的 数据 库 @ 

-h，- -host= 主 机 名 数据 库 服 务 器 主机 或 套 接 字 目录 
-p，--port= 端 口号 数据 库 服务 器 端口 号 
-U，--username= 名 称 作为 指定 数据 库 用 户 连 接 
-W，--no-password 永远 不 提示 输入 密码 

-W, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 





--role=ROLENAME 





在 转 储 之 前 执行 SET ROLE 命令 


PostgreSQL 9.3 版 中 引入 的 新 特性 。 


PostgreSQL 9.4 版 中 引入 的 新 特性 。 
@ @ PostgreSQL 9.2 版 中 引入 的 新 特性 。 


月 SET SESSION AUTHORIZATION 命 令 代替 ALTER OWNER 命 





PostgreSQL 自 带 的 命令 行 











B.2 服务 器 级 备份 工具 pg_dumpall 


使 用 pg_dumpall 工具 可 以 将 服务 器 上 的 所 有 数据 库 备份 到 
SQL 文件 上 。 该 备份 工具 将 自动 备份 角色 和 表 空 
个 数据 库 。 示 例 B-2 列 出 了 pg_dumpatL 的 所 有 帮助 信息 。pg_dumpall 的 具体 用 法 请 


任何 一 





参考 2.72 市 的 内 容 。 


示例 B-2: pg_dumpall 帮助 信息 


pg_dum 


pg_dumpalLL 可 以 将 一 个 PostgreSQL 数 据 库 集 群 中 的 所 有 数据 都 提取 到 一 个 SQL 脚本 文件 








用 法 : 
pg_dum 




















通用 选区 


， 汪 芍 


pall - -helLp 
paLL [选项 ]... 


项 : 
--file= FILENAME 











EE 


偷 出 文件 名 


-Lock-wait- timeout=TIMEOUT 等 待 表 锁 超 时 后 操作 失败 


help 
--Vvers 


和 


-X， 
--bina 
--COLU 


--disable-dollar-quoting 


--disa 


ion 


出 内 容 的 选项 : 





--data-only 
--Clean 
--globals-only 
--Oids 
--no-owner 
--roles-only 
--schema-only 
--superuser=NAME 
--tablespaces-only 
--no-privileges 


ry-upgrade 
mn-inserts 


ble-triggers 


--inserts 


-~ 


ecurity-labels 


--no-tablespaces 


--no-unlogged-table-data 
--quote-all-identifiers 
--Use-set-session-authorization 





~ 


- 


-vv 


- 


je eo A 
三 Como 记 渡 


洲 
:党 
六 


dbname=CONNSTR 


--host= 主 机 名 
--database=DBNAME 
--port= 端 口号 
--Username= 名 称 
--no-password 
，--password 


276ies ROLENAME 


| 


显示 此 帮助 信息 并 退出 
给 出 版 本 信息 并 退出 
































在 转 储 中 包含 0ID 

















要 在 转 储 中 使 用 
仅 转 储 表 空 
不 转 储 特权 (grant/revoke 
仅 供 升 级 工具 使 用 














以 带 有 列 名 的 INSERT 命 令 的 形 
引号 ,而 是 使 月 
在 仅 恢复 数据 期 间 禁 用 触发 办 
以 INSERT 命 令 ( 而 非 COPY 命 令 ) 的 形式 转 储 数据 




















禁用 美元 (符号 ) 











不 转 储 安全 标签 分 配 
不 转 储 表 空 间 分 配 





不 转 储 不 记录 WAL 日 志 的 表 的 数据 





) 


仅 转 储 数据 ,而 不 转 储 schema 
重新 创建 数据 库 之 前 清除 (删除 ) 数 据 库 
仅 转 储 全 局 对 象 ,而 不 转 储 数据 库 


个 纯 文 本 文件 或 者 
间 等 系统 级 对 象 的 信息 ， 这 类 信 ， 








以 纯 文本 格式 跳 过 对 象 所 有 权 的 恢复 
仅 转 储 角 色 ,而 不 转 储 数据 库 和 
仅 转 储 schema , 而 不 转 储 数据 
的 超级 用 户 用 
E 间 ,而 不 转 储 数据 库 和 角色 


[ 表 空 间 
户 名 











式 转 储 数据 
日 SQL 标 准 引号 








所 有 标识 符 加 引号 ,即使 不 是 关键 字 也 加 


命令 来 设置 所 有 权 














使 用 连接 连接 串 连接 @ 

数据 库 服 务 器 主机 或 套 接 字 目录 
末代 默认 数据 库 
数据 库 服务 器 端口 号 

作为 指定 数据 库 用 户 连 接 
永远 不 提示 输入 密码 

虽 制 要 求 输入 密码 (应 该 自动 发 及 
在 转 储 之 前 执行 SET ROLE 命令 





E 主 
































汤 





— 








个 纯 文本 
息 不 属于 





使 用 SET SESSION AUTHORIZATION 命 令 代 禁 ALTER OWNER 
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录 B 


如 果 未 使 

















]-f/--file, 则 会 将 SQL 脚 本 写 到 标准 

















输出 中 。 





@ ” ”PostgreSQL 9.3 版 中 引入 的 新 特性 。 





B.3 database 数 据 恢 复工 具 pg_restore 


可 以 使 用 pg_restore 可 恢复 使 用 pg_dump 创建 备份 文件 ， 这 些 备份 文件 的 格式 包括 TAR 


包 格式 、 自 定义 压缩 格式 以 及 目录 格式 等 


有 关 使 用 pg_restore 的 实例 , i 


示例 B-3: pg_restore 者 


pg_restore - 


pg_restore 可 以 从 pg_dump 创 建 的 存档 中 恢复 一 个 PostgreSQL 数 据 库 。 





帮助 信息 
-help 














等 。 示 例 B-3 是 pg_restore 命令 的 帮助 信息 。 更 多 


青 参 见 2.7.3 节 。 





























































































































用 法 : 
pg_restore [选项 ]... [文件 名 ] 

通用 选项 : 

-d，--dbname=NAME 连接 到 数据 库 名 称 

-f，- -fiLe= 文 件 名 输出 文件 名 

F，--format=c|d|t 备份 文件 格式 (应 该 是 自动 的 ) 

-人 ，--List 打印 存档 的 汇总 目录 

v, --verbose 详细 信息 模式 

-V，--version 输出 版 本 信息 并 退出 

-?, --help 显示 此 帮助 信息 并 退出 
恢复 控制 选项 : 

-a, --data-only 仅 恢复 数据 ,而 不 恢复 schema 

-Cc, --clean 在 重新 创建 数据 库 对 象 之 前 清除 (删除 ) 数 据 库 对 象 
-C，--create 创建 目标 数据 库 

-e, --exit-on-error 恢复 期 间 发 生 错误 时 退出 , 若 不 设 定 则 默认 为 继续 恢复 
-I, --index=NAME 恢复 命名 索 引 

-j，--jobs=NUN 使 用 这 多 个 并 行 作业 进行 恢复 

-L, --use-list=FILENAME 将 此 文件 的 目录 用 于 选择 输出 或 对 输出 进行 排序 
-n,--schema=NAME 仅 恢复 此 schema 中 的 对 象 

-0，--no-owner 足 过 对 象 所 有 权 的 恢复 

-P, --function=NAME(args) 恢复 命名 函数 

-Ss, --schema-only 叉 恢复 schema , 而 不 恢复 数据 

-S, --superuser=NAME 用 于 禁用 触发 器 的 超级 用 户 用 户 名 

-t, --table=NAME 恢复 命名 表 
-T, --trigger=NAME 恢复 命名 触发 器 
-x, --no-privileges 跳 过 访问 特权 (grant/revoke) 的 恢复 
-1, --single-transaction 作为 单个 事务 恢复 


--disable-triggers 
--no-data-for-failed-tables 
--no-security-labels 
--no-tabLespaces 
--Section=SECTION 








在 仅 恢 复数 据 期 间 禁 用 触发 器 

如 果 表 创建 失败 , 则 不 对 其 进行 数据 恢复 

不 恢复 安全 标签 

不 恢复 表 空间 分 配 

恢复 命名 部 分 (包括 三 个 部 分 :pre-data、data 以 及 post-data。 
data 部 分 包含 表 记 录 数 据 、 大 对 象 数据 以 及 序列 的 值 ;post- 
data 部 分 包含 索引 、 触 发 器 .规则 和 约束 (除了 验证 检查 约束 ) 的 
定义 ;pre-data 部 分 包含 此 外 其 他 所 有 的 对 象 定义 ) 























PostgreSQL 自 带 的 命令 行 





0 





























--Use-set-session-authorization 使 用 SET SESSION AUTHORIZATION 命 令 代 赫 ALTER 
OWNER 命 令 来 设置 所 有 权 
连接 选项 : 
-h，- -host= 主 机 名 数据 库 服 务 器 主机 或 套 接 字 目 东 
-p，- -port= 端 口号 数据 库 服务 器 端口 号 
-U，- -usernane= 名 称 作为 指定 数据 库 用 户 连 接 
-W，--no-password 永远 不 提示 输入 密码 
-NM，--password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 
-role=ROLENAME 在 恢复 之 前 执行 SET ROLE 命 令 





@ PostgreSQL 9.2 版 中 引入 的 新 特性 。 


B.4 ”交互 模式 下 的 psql 命 令 
示例 B-4 中 列 出 了 psql 交互 模式 下 支持 的 命令 行 。 请 参考 3.1 节 和 3.2 节 的 例子 ， 了 解 其 
使 用 方法 。 

















示例 B-4: psql 交互 模式 下 支持 的 命令 























\? 

通用 命令 
\copyright 显示 PostgreSQL 使 用 和 分 发 条 者 
\g [文件 ] or ; 执行 查询 (并 将 结果 发 送 给 人 
\gset [PREFIX] 执行 查询 并 将 结 吉 果 存储 到 psql 变 量 中 @ 
\h [名 称 ] 关于 SQL 命 令 语 法 的 帮助 ， * 代 表 所 有 命令 
\q 退出 psql 
\watch [SEC] 每 隔 SEC 秒 执行 一 次 查询 @ 

查询 缓冲 区 相关 命令 





\e [FILE] [LINE] 使 用 外 部 编辑 器 编辑 查询 缓冲 区 (或 文件 ) 








































































































\ef [FUNCNAME [LINE]] 使 用 外 部 编辑 器 编辑 函数 定义 

\p 显示 查询 缓冲 区 的 内 容 

\r 重 置 (清除 ) 查 询 缓冲 区 

\w 文件 将 查询 缓冲 区 写 入 到 文件 

输入 /输出 相关 命令 

\copy . 执行 SQL COPY, 将 数据 流 发 送 到 客户 端 主 机 

\echo [字符 串 ] 将 字符 串 写 到 标准 输出 

\i 文件 从 文件 执行 命令 

\ir FILE 与 \i 类 似 ,但 是 在 脚本 中 执行 时 ,认为 目标 文件 的 位 置 是 当前 脚本 所 
在 的 目录 @ 

\o [文件 ] 将 所 有 查询 结果 发 送 到 文件 或 | 管 

\qecho [字符 串 ] 将 字符 串 写 入 到 查询 输出 流 ， ee 区 别 是 所 有 输出 将 
写 入 由 \o 设 置 的 输出 通道 

信息 查询 命令 

(选项 :$ = 显示 系统 对 象 ,+ = 附加 的 详细 信息 ) 

\d[S+] 输出 表 、 视 图 和 序列 列表 

\d[S+] 名 称 描述 表 、 视 图 .序列 或 索引 

\da[S] [模式 ] 输出 聚合 函数 列表 

\db[+] [模式 ] 输出 表 空 间 列表 

\dc[S] [模式 ] 给 出 编码 转换 (converston) 列 表 
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\dc [模式 ] 
\dd[S] [模式 ] 
\ddp [模式 ] 
\dD[s] [模式 ] 
\det[+] [模式 ] 
\des[+] [模式 ] 
\deu[+] [模式 ] 
\dew[+] [模式 ] 
\df[antw][S+] [模式 ] 4 


\dF[+] [模式 ] 
\dFd[+] [模式 ] 
\dFp[+] [模式 ] 
\dFt[+] [模式 ] 
\dg[+] [模式 ] 
\di[s+] [模式 ] 
\dl 

\dL[S+] [模式 ] 
\dm[S+] [模式 ] 
\dn[S+] [模式 ] 
\do[S] [模式 ] 
\do[S+] [模式 ] 
\dp [模式 ] 
\drds [模式 1 [模式 2]] 
\ds[S+] [模式 ] 
\dt[S+] [模式 ] 
\dT[S+] [模式 ] 
\du[+] [模式 ] 
\dv[S+] [模式 ] 
\dE[S+] [模式 ] 





\dx[+] [模式 ] 
\dy [模式 ] 
\LL+] 
\sf[+] FUNCNAME 
\z [模式 ] 
关 命令 
a 


\C [字符 串 ] 
\f [字符 串 ] 
\H 

\pset NAME [VALUE] 





\t [on|off] 
\T [字符 串 ] 
\x [on|off] 





连接 相关 命令 
N\c[onnect] [DBNANME | - 
\encoding [编码 名 称 ] 
\password [USERNAME] 
\conninfo 

操作 系统 相关 命令 
\cd [目录 ] 
\setenv NAME [VALUE] 


记 


示 对 象 上 的 注 


和 如 





上 默认 权限 用 
H 域 列表 


党 这 这 


> 





Ah Rt Rt 
人 Ei 





数 ) 列 表 


> 民 


用 户 映射 列表 
外 部 数据 封装 器 列表 


特定 类 型 函数 ( 仅 a- 聚 合 函数 /n- 常 规 函 数 /t- 触 


出 类 型 强制 转换 (cast) 列 表 


E 释 





表 


出 外 部 表 列 表 
i 出 外 部 服务 器 列表 





文本 搜索 配置 列表 





> 


文本 搜索 全 








列表 





> 





> 


> 


角色 列表 
索引 列表 


> 


> 


> 


> 


=> 


癌 :i 癌 :i 





一 一 一 一 一 压 一 王 一 一 一 一 王 








当 





Ec 


> 


序列 列表 
H 表 列表 


> 二 





> 三 





> 二 


角色 列表 
tH 视图 列表 


=> 


> 


扩展 列表 


> 














二 于 元 芝 过 区 地区 地 
I 与 一 一 压 三 王 王 一 压 一 一 





中 


显示 函数 定义 


数据 类 型 列表 


文本 搜索 解析 器 列表 
文本 搜索 模版 列表 








Kr pl 


@ 











外 部 表 列 表 


事件 触发 器 列表 @ 
数据 库 列表 


和 \dp 的 功能 相同 





在 非 对 齐 输出 模式 和 对 齐 输 
设置 表 标 题 ; 或 者 如 果 没 有 ， 








大 对 象 列表 ， 与 \Lo_List 相 同 
过 程 语言 列表 
物化 视图 2 
Hschema 列 表 
运算 符 列 表 
排序 规则 列表 
H 表 .视图 和 序列 访问 权限 列表 
出 每 个 database 的 角色 设置 列表 


出 模式 之 间 切 换 
则 不 设置 


显示 或 设置 非 对 齐 查询 输出 的 字段 分 隔 符 
切换 HTML 输 出 模式 (当前 关闭 ) 

设置 表 输 出 选项 (NAME 的 可 选项 有 format border .expanded、 
fieLdsep、fieLdsep_zero footer .null. .numericlocale, recordsep、 
tupLes_ontLy titLe tableattr .pager) 


仅 显示 行 (当前 关闭 ) 











设置 HTML 


切换 扩展 输出 (当前 关闭 ) 


USER|- HOST|- 








设置 或 取消 设置 环境 


OO 


发 器 函数 /w- 窗 口 


PORT|-] 连接 到 新 的 database( 当 前 是 “postgres”) 
显示 或 设置 客户 端 编码 
安全 地 为 用 户 更 改 密码 
显示 当前 连接 的 相关 信息 


更 改 当 前 工作 目录 





变量 @ 











PostgreSQL 自 带 的 命令 行 





\timing [onloff] 切换 命令 计时 开关 (当前 关闭 ) 


! [命令 ] 在 shell 中 执行 命令 或 启动 交互 式 shell 
O@ @ PostgreSQL 9.3 版 中 引入 的 新 特性 。 
99 
上 日 6” PostgreSQL 9.2 版 中 引入 的 新 特性 。 
© 











@ PostgreSQL 9.4 版 中 引入 的 新 特性 。 你 可 以 使 用 不 带 任何 实 参 的 \pset 命令 来 输出 所 有 
的 可 选项 及 其 当前 值 。 


B.5 非 交 互 模式 下 的 psql 命 令 


示例 B-5 是 非 交 互 模式 下 psql 的 命令 行 帮助 信息 。 关 于 该 模式 下 的 具体 使 用 例子 请 参考 
3.2 节 的 内 容 。 
































示例 B-5: psql 基本 帮助 信息 



































































































































psql --help 

psql 是 PostgreSQL 的 交互 式 终端 。 

使 用 方法 : 

psql [选项 ]... [database 名 称 [用 户 名 ]] 

通用 选项 : 

-C,--Command= 命 今 仅 运 行 单个 命令 (SQL 或 内 部 命令 ) ,然后 退出 
-d4，- -dbname= 数 据 库 名 称 ”要 连接 到 的 数据 库 名 称 
-f，--file= 文 件 名 从 文件 执行 命令 ,然后 退出 

-1l, --list 列 出 可 用 的 数据 库 ,然后 退出 
-Vv，--set=，--variable= 名 称 = 值 将 psql 变 量 NAME 设 置 为 VALUE 
-X, --no-psqlrc 不 读 取 启动 文件 (~/ .psqlrc) 

-1 ("one")，--single-transaction 将 命令 文件 作为 单一 事务 执行 
--help 显示 此 帮助 信息 并 退出 

--version 输出 版 本 信息 并 退出 

输入 和 输出 选项 : 

-a, --echo-all 回 显 所 有 来 自 于 脚本 的 输入 

-e, --echo-queries 回 显 发 送 给 服务 器 的 命令 

-E, --echo-hidden 显示 内 部 命令 生成 的 查询 
-L，--Log-fiLe= 文 件 名 将 会 话 日 志 发 送 给 文件 
-n，--no-readLine 禁用 增强 命令 行 编辑 功能 (readLine) 
-0，--output=FILENAME ”将 查询 结果 发 送 给 文件 (或 | 管道 ) 
-q9，--quiet 以 静默 模式 运行 (不 显示 消息 , 仅 显 示 查 询 输 出 ) 
-s, --single-step 单 步 模式 (每 个 查询 均 需 确认 ) 

-S, --single-line 单行 模式 (SQL 命 令 不 允许 跨行 ) 

输出 格式 选项 : 

-A，--no-aLign 韭 对 齐 表 输 出 模式 





-F，--field-separator= 字 符 串 设置 字段 分 隔 符 (默认 为 1”) 
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-H，- -htmlL HTML 表 输出 模式 

-P, --pset=VAR[=ARG] 将 打印 选项 VAR 设 置 为 ARG( 参 见 \pset 命 令 ) 
-R，--record-separator= 字 符 串 设置 记录 分 隔 符 ( 默 认为 换行 符 ) 
-t, --tuples-only 仅 打 印行 

-T，--table-attr= 文 本 ”设置 HTML 表 标记 属性 (例如 :宽度 .边框 等 ) 
-X，--expanded 打开 扩展 表 输 出 

z 


-z, --field-separator-zero @ 
将 字段 分 隔 符 设 置 为 零 字 
-0，--record-separator-zero @ 


将 记录 分 隔 符 设置 为 零 字 


dH 











dH 
































连接 选项 ， 

-h，- -host= 主 机 名 数据 库 服 务 器 主机 或 套 接 字 目录 
-p，- -port= 端 口 数据 库 服务 器 端口 (默认 为 “5432”) 
-U，--username= 用 户 名 ”数据 库 用 户 名 
-W，--no-password 永远 不 提示 输入 密码 

-WH, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 








如 需 了 解 更 多 信息 ,请 在 psqL 中 输入 “\?”( 用 于 内 部 命令 ) 或 者 \heLp”( 用 于 SQL 命令 ) ,或 者 参考 
PostgreSQL 官 方 和 手册 中 的 psql 部 分 。 


@ @ PostgreSQL 9.2 版 中 引入 的 新 特性 。 
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作者 简介 

Regina Obe 是 位 于 美国 波士顿 的 数据 库 咨 询 服 务 公 司 Paragon Corporation 的 负责 人 之 一 。 
她 有 着 15 年 以 上 的 数据 库 领 域 从 业经 验 ， 精 通 多 种 编程 语言 和 数据 库 系统 ， 特 别 是 在 空间 
数据 库 方面 万 为 专长 。 她 是 PostGIS 指导 委员 会 成 员 ， 同 时 也 是 PostGIS 核心 开发 团队 的 成 
员 。 Regina 拥有 麻 省 理工 学 院 机 械 工程 学 士 学 位 ， 是 PostGIS in Action 一 书 的 作者 之 一 。 
Leo Hsu 也 是 Paragon Corporation 公司 的 负责 人 之 一 。 他 有 着 超过 15 年 的 数据 库 领 域 从 业 
经 验 ， 曾 为 许多 不 同 规模 的 公司 和 组 织 做 过 数据 库 开 发 工作 ， 对 数据 库 领 域 有 着 非常 深入 
的 思考 和 研究 。Leo 拥有 斯 坦 福 大 学 经 济 系统 工程 硕士 学 位 以 及 麻 省 理工 学 院 机 械 工 程 与 
经 济 学 硕士 学 位 ， 他 也 是 PostG1S in 4ction 一 书 的 作者 之 一 。 


封面 介绍 


本 书 封 面 上 的 动物 是 象 移 (拉丁 名 为 Macroscelides proboscideus) ， 这 是 一 种 原 产 于 非洲 的 
食 虫 性 哺乳 动物 ， 广泛 分 布 于 非洲 南部 ， 因 有 着 类 似 大 象 的 长 鼻 而 得 名 。 它 们 能 够 适应 各 
种 各 样 的 生存 环境 : 无 论 是 纳米 布 沙 漠 ， 还 是 砾石 覆盖 的 南部 非洲 地 区 ， 甚 至 茂密 的 森林 
地 带 ， 都 是 它们 的 栖 居 之 地 。 

象 移 是 一 种 体型 很 小 的 四 足 动物 。 由 于 尾巴 非常 相似 ， 因 此 象 移 外 表 上 看 起 来 像 是 老 所 或 者 
负 筷 。 相 较 于 其 体型 来 说 ， 它 们 的 腿 可 以 说 是 相当 之 长 ， 因 此 它们 可 以 跳跃 行走 ， 看 起 来 和 
兔子 很 相似 。 它 们 的 鼻子 部 分 根据 亚 种 的 不 同 而 长 度 各 异 ， 但 在 寻找 食物 时 都 可 以 左右 捏 动 。 
虽然 象 移 是 一 种 活跃 的 屋 行 性 动物 ， 但 由 于 其 个 性 机 警 ， 所 以 一 般 很 难 见 到 或 者 捕捉 到 它 
们 。 它 们 很 善于 伪装 ， 在 遇 到 危险 时 会 迅速 逃避 。 

象 网 并非 高 度 群 居 性 的 动物 ， 很 多 个 体 都 是 以 一 夫 一 妻 的 方式 结伴 生活 并 共同 保护 它们 的 
领地 。 唆 性 象 购 有 着 类 似 人 类 女性 的 月 经 周期 ， 其 发 情 期 会 持续 好 几 天 。 肉 性 个 体 怀 孕 以 
后 ， 其 妊娠 期 会 持续 45 至 60 天 ， 一 年 会 生育 若干 胎 ， 每 胎 约 有 1~3 只 幼 移 。 幼 移出 生 时 
其 身体 已 经 发 育 得 比较 完全 ， 几 天 后 就 会 离开 集 穴 。 

出 生 五 天 之 后 ， 幼 移 开 始 进食 昆虫 ， 这些 昆虫 由 它们 的 母亲 捕获 并 衔 在 口中 携带 回来 。 幼 
散会 在 出 生 之 后 大 约 15 天 开始 尝试 独立 生活 并 逐步 减少 对 母亲 的 依赖 。 随 后 它们 会 圈定 
自己 的 领地 ， 并 在 41 至 46 天 之 内 达到 性 成 熟 状 态 。 

成 年 象 骨 主要 以 无 背 椎 动物 为 食 ， 比 如 昆 求 、 牧 蛛 、 昌 旷 、 干 足 求 以 及 是 电 等 。 要 想 吃 掉 
个 头 更 大 些 的 猎物 对 它们 来 说 会 有 点 困难 ， 它 们 必须 用 脚 拖 住 猎物 ， 再 用 牙 此 把 食物 括 扯 
成 碎片 ， 等 这 些 碎片 落 到 地 上 之 后 象 散 会 像 食 蚁 普 那 样 用 去 头 将 这 些 碎片 匡 进 嘴 里 。 象 葛 
同时 也 是 植 食性 动物 ， 如 果 能 找 得 到 的 话 ， 嫩 叶 、 种 子 、 小 型 果实 等 也 都 是 它们 的 美食 。 
很 多 出 现在 O'Reilly 图 书 封面 上 的 动物 都 濒临 灭绝 ， 它 们 的 存在 对 于 维持 地 球 的 物种 多 样 性 
非常 重要 ， 如 果 你 希望 能 为 保护 它们 尽 一 份 力量 ， 请 访问 animals.oreilly.com 以 了 解 详 情 。 
封面 图 片 来 自 于 Meyers Kleines 词典 。 
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欢迎 加 入 


图 灵 社 区 iTuring.cn 





最 前 沿 的 IT 类 电子 书 发 售 平台 


电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同 行 还 在 犹豫 入 得 的 时 候 ， 图 灵 社 区 已 经 采取 实 
际 行动 拥抱 这 个 出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 开 类 出 版 商 ， 图 灵 社 区 目前 为 读者 
提供 两 种 DRM-free 的 阅读 体验 : 在 线 阅 读 和 PDF。 

相 比 纸 质 书 ， 电 子 书 具 有 许多 明显 的 优势 。 它 不 仅 发 布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩 
色 图 片 ( 即使 有 的 书 纸 质 版 是 黑白 印刷 的 )。 读 者 还 可 以 方便 地 进行 搜索 、 剪 贴 、 复 制 和 打印 。 

图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 书 出 版 业务 紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 
稿 、 编 辑 网 上 审 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模式 ， 我 们 称 之 为 “人 敏捷 出 
版 ”， 它 可 以 让 读者 以 较 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 往 翻 译 版 技术 书 
“出 版 即 过 时 ”的 缺憾 。 同 时 ， 敏 捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 提前 消炎 
书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 的 质量 。 
















































































优惠 提示 : 现在 购买 电子 书 ， 读 者 将 获 赠 书 款 20% 的 社区 银子 ， 可 用 于 免 换 纸 质 样 书 。 





最 方便 的 开放 出 版 平台 


图 灵 社 区 向 读者 开放 在 线 写 作 功 能 ， 协 助 你 实现 自 出 版 和 开源 出 版 的 梦想 。 利 用 “合集 ” 
功能 ， 你 就 能 联合 二 三 好 友 共 同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 的 形式 提供 给 读者 。( 收 
费 形式 须 经 过 图 灵 社 区 立项 评审 。 ) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 的 意愿 ， 图 灵 
社区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 书稿 ， 有 机 会 和 人选 出 版 计划 ， 同 时 出 版 纸 质 书 。 

图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 社区 公布 。 如 果 你 有 意 翻译 哪 本 图 
书 ， 欢 迎 你 来 社区 申请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 译 者 。 当 然 ， 要 想 成 功 
地 完成 一 本 书 的 翻译 工作 ， 是 需要 有 坚强 的 毅力 的 。 


最 直接 的 读者 交流 平台 


在 图 录 社 区 ,你 可 以 十 分 方便 地 写作 文章 、 提 交 勘 误 、 发 表 评 论 ， 以 各 种 方式 与 作 详 者 、 
辑 人 员 和 其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 银子 。 

你 可 以 积极 参与 社区 经 常 开展 的 访谈 、 乐 译 、 评 选 等 多 种 活动 ， 赢 取 积 分 和 银子 ， 积 累 个 人 
声望 。 
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名 于 网 灵 最 新 重点 图 书 


大 数据 权威 著作 全 新 升级 版 ! 
> 第 1 版 畅销 40000 册 ! 


[CT 四 灵 酝 局 设 读书 
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恒 本 书 源 自作 者 在 斯 坦 福 大 学 教授 的 “海量 数据 挖 
me 据 ”( CS246: Mining Massive Datasets ) 课程 ， 第 1 版 上 

市 以 来 受到 读者 广泛 欢迎 和 认可 。 本 书 以 大 数据 环境 下 

Mining of Massive Datasets 的 数据 挖掘 和 机 融 学 习 为 重点 ， 全 面 介绍 了 实践 中 行 之 





有 效 的 数据 处 理 算法 ， 是 在 校 学 生 和 相关 从 业 人 员 的 必 


大 数据 备 读物 。 





互联 网 大 规模 数据 挖 据 
与 分 布 式 处 理 (第 2 版 ) 
大 数据 (第 2 版 ) 
at 区 起 光 下 了 书号 : 978-7-115-39525-2 


定价 : 79.00 元 
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Spark 高 级 数据 分 析 Spark 快速 大 数据 分 析 命令 行 中 的 数据 科学 

书号 : 978-7-115-40474-9 书号 : 978=7~115=40309=4 书号 : 978=7=115=39168=1 
定价 : 59.00 元 定价 : 59.00 元 定价 : 49.00 元 
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学 习 JavaScript 
士 
由 英特尔 专家 柜 写 ， 让 读者 擎 振 云 网 络 基本 软 硬 件 设施 数据 结构 与 算法 
和 设计 方法 ， ei 
aasaun Cay onel El ome mis 
网 rm 六 人 了 人 直 人 网 中 rimman 入 A 时 TL 
数据 科学 实战 云 数 据 中 心 网 络 技术 学 习 JavaScript 数据 结构 与 算法 
书号 : 978-7-115-38349-5 书号 : 978-7-115-40518-0 书号 : 978-7-115-40414-5 








定价 : 79.00 元 定价 : 49.00 元 定价 : 39.00 元 


关注 图 灵 教育 关注 图 灵 社 区 
iTuring.cn 


在 线 出 版 电子 书 《 码 农 》 杂 志 图 灵 访 谈 …… 
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QQ 联系 我 们 


灵 读 者 官方 群 1: 218139230 
图 灵 读 者 官方 群 I[: 164939616 


微 博 联系 我 们 
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官方 账号 ， @ 图 灵 教 育 @ 图 灵 社 区 @ 图 灵 新 知 
市 场合 作 : @ 图 灵 责 野 

写作 本 版 书 : @ 图 灵 小 花 @ 图 灵 张 霞 

翻译 英文 书 : @ 朱 出 ituring @ 楼 伟 珊 

翻译 日 文书 或 文章 : @ 图 灵 乐 声 

翻译 韩文 书 : @ 图 灵 陈 曦 
电子 书 合 作 : @hi_jeanne 

图 灵 访 谈 /《 码 农 》 杂 志 : @ 李 盼 ituring 
加 入 我 们 : @ 王 子 是 好 人 
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PostgreSOL 即 学 即 用 (第 2 版 ) 


你 是 否 正在 考虑 将 业务 系统 数据 库 迁 移 到 PostgreSQL 上 ? 本 书 内 容 简明 
扼要 、 提 纲 击 领 ， 是 极 佳 的 PostgreSQL 快 速 上 手指 南 ， 可 以 帮助 你 快 
速 地 学 习 、 理 解 并 运用 好 这 款 开 源 数据 库 。 从 本 书 中 ， 你 不 仅 能 学 到 
PostgreSQL 9.2、9.3 和 9.4 版 中 的 企业 级 特性 ， 还 将 了 解 到 PostgreSQL 不 
但 是 一 套数 据 库 系统 ， 更 是 一 个 功能 强大 的 应 用 开发 平台 。 


本 书 以 众多 示例 贯穿 始终 ， 演 示 了 如 何 实现 在 别 的 数据 库 中 难以 实现 或 
者 根本 不 可 能 实现 的 任务 。 本 书 第 2 版 涵盖 了 LATERAL 横 向 关联 查询 语 
法 、 增 强 的 JSON 支 持 、 物 化 视图 机 制 以 及 其 他 重要 功能 特性 。 即 使 你 已 
经 是 PostgreSQL 用 户 ， 也 能 从 本 书 中 学 到 以 前 未 曾 了 解 过 的 一 些 功能 。 


通过 阅读 本 书 ， 你 将 学 到 ， 
四 如 何 执行 基本 的 数据 库 管 理 任务 ， 比 如 角色 管理 、 数 据 库 创 建 以 
及 数据 备份 和 恢复 等 ， 


国 如 何 使 用 psql 命 令 行 工 具 以 及 pgAdmin 图 形 化 管理 工具 ， 

国 PostgreSQL 的 表 、 约 束 和 索引 等 数据 库 对 象 的 特性 和 使 用 方法 ， 
国 PostgreSQL 所 特有 的 若干 功能 强大 的 SQL 语法 ， 

国 如 何 使 用 多 种 不 同 的 编程 语言 来 编写 PostgreSQL 函 数 ， 

回 如 何 实施 语句 调 优 以 充分 挖掘 服 务 器 硬件 的 潜能 ， 
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“这 本 书 篇 幅 不 长 …… 对 系统 管 


理 员 、 数 据 库 管理 员 以 及 开 
发 人 员 来 说 ， 如 果 有 其 他 数 
据 库 系统 的 使 用 经 验 ， 希 望 不 
必 深 入 研究 各 类 细节 就 能 够 对 
PostgreSQL 快 速 上 手 ， 那 么 阅 
读 这 本 书 再 合适 不 过 了 。” 
一 一 Andrew Dunstan 
PostgreSQL Experts 公 司 高 级 顾问 ， 
PostgreSQL 核 心 代 码 提交 者 





Regina Obe 是 数据 库 咨 询 公 司 
Paragon 的 负责 人 之 一 ， 在 编程 
语言 和 数据 库 系统 方面 有 15 年 以 
上 的 专业 经 验 。 她 是 PostGIS 指 导 
委员 会 成 员 ， 也 是 PostGIS 核 心 开 
发 团队 的 成 员 。PostG/S in Action 
一 书 的 合 著者 。 

Leo Hsu 也 是 Paragon 公 司 的 负责 
人 之 一 ， 曾 为 大 大 小 小 的 组 织 
发 过 数据 库 ， 有 15 年 以 上 的 专业 
经 验 。PostGIS in Acton 一 书 的 合 
著者 。 
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